找回密码
 注册

Sign in with Twitter

It's what's happening?

微信登录

微信扫一扫,快速登录

查看: 176|回复: 0

AI圈、币圈、数据党

[复制链接]
发表于 2025-12-4 00:07 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册 微信登录

×
作者:微信文章
w1.jpg

书山有路,先干为敬;学海无涯,回头是岸

最近IT圈有两个大话题。哦对了,现在没人叫IT了,大家应该叫AI圈和币圈。AI圈,今秋以来的AI泡沫见顶、Scaling Law失效的讨论,被Gemini 3的全面升级几乎淹没了,全面,不仅是技术全面,还是应用全面。币圈呢,被去杠杆、获利回吐、微策略退指等等合并引发了比特币价格跳水。昨天又回升了一些。

w2.jpg

翻了翻我过去说的话,开春的时候,我说过AI圈一地鸡毛,进步更靠数据质量而不是算力,也就是Scaling Law快失效了;我也说过,赶紧入手,期待高点就抛,不要超过年底。这两个圈都不圈我,从他们的角度看,我只是个野人,我这个野人只是对他们圈里的数据敏感。

既然野人说话了,咱们就先从AI市场这个“Scaling Law”的开始说说。所谓的Scaling Law(缩放定律),在很长一段时间里被奉为硅谷的圭(gui)臬(nie)。它的核心假设简单粗暴:只要基于海量数据的堆积,再配合上无限叠加的算力,AI就能自然涌现出超强智能。但这套逻辑忽略了一个最致命的变量——数据的质量。它默认所有的数据都是知识,却忘了垃圾进、垃圾出的古老真理。

w3.jpg

实际上,数据的好坏,直接决定了智能实现的“加速度”,以及最终能否达成真正的“创造性”。举个例子,如果我们把互联网上所有的口水帖、SEO垃圾文和重复的废话都喂给模型,哪怕你用了核电站级别的算力,训练出来的依然是一个满嘴跑火车的庸才。真正优质的数据——那些经过严密逻辑推导的数学证明、高质量的代码、深度的哲学思辨——其实并不需要天文数字般的算力来“大力出奇迹”。恰恰相反,如果让大算力去强行拟合那些垃圾数据,后果更可怕:它不仅浪费了能源,更会让模型在错误的逻辑上越跑越远,直接把模型“带歪”。这时候我们才发现,相比于盲目堆砌显卡,如何清洗掉噪音、提炼出高纯度的信息,才是打破Scaling Law瓶颈的关键。三月份我说“进步更靠数据而不是算力”,指的就是这个道理。

说完了AI的“虚火”,再来看看币圈的“实锤”。比起AI圈还在争论模型参数,币圈的数据更加赤裸——全是钱。最近这波价格跳水,看似惊心动魄,实则都在数据的射程之内。仔细分析资金流向、杠杆率高低以及量化交易的痕迹,你会发现,这是一场预谋已久的“撤退”。当杠杆率被推高到极致,量化交易机器人在毫秒级别内捕捉到风吹草动,引发连锁平仓,价格崩塌是必然的物理反应。再加上主流国家监管趋势的收紧,去杠杆、获利回吐成了资本的共同选择。

w4.jpg

但如果我们把视角拉长,跳出K线图,去看看比特币最底层的“数据协议”,一切又变得清晰起来。比特币的历史,本质上就是一道关于时间的数学题。它的总供给量被死死锁定在2100万枚,每四年减半的机制决定了每年挖矿出币的速度。我们只要算一算已经被挖出的币量,对比剩余的库存,就能算出大概到什么时间所有的币会被“挖空”。这个枯燥的数学过程,却映射出了人性的变迁。早年间,那些守在破旧电脑前挖矿的人,多是长期的技术理想派(Cypherpunks)。他们手里持有的币,代表的是对去中心化世界的信仰,是“不论价格如何我都拿着”的硬骨头。后来,随着难度增加,挖出的币流向了币圈投机客,他们看重的是波动率。而到了现在,剩下的、越来越难挖的币,几乎全都被拥有庞大算力的投机资本包圆了。现在的比特币,早已不是当年那个极客玩具。早期挖出的币还在沉睡或被信仰者收藏,而新产生的币,一出生就被打上了资本的烙印,随时准备在交易所里为了0.5%的利差厮杀。

从AI圈的Scaling Law失效,到币圈的资本博弈,这两个行业的演变趋势其实殊途同归:它们都在用血淋淋的事实告诉我们,数据与智能的关系,绝不是线性的“大力出奇迹”,而是一种非线性的质变逻辑。简单说,不是数据的量,而是数据的质,决定了思维的高度。

w5.jpg

这就引入了一个关键概念——数据的质量究竟从何而来?我认为有两个来源:一是原始质量,二是筛选质量。原始质量,那是老天赏饭吃,比如你拥有独家的科研数据、绝密的金融档案,这是资源禀赋。但更关键的,是筛选质量,这完全取决于自主的学习能力。在这个维度上,我们不妨大胆对比一下Gemini和ChatGPT这两大流派。为什么Gemini 3能这次能全面爆发?甚至在很多人看来,它的学习能力比同行更高?很大程度上是因为它骨子里流淌着DeepMind的血液。早在AlphaGo时期,它(或者是它的前身)就已经玩转了围棋的数据。围棋的复杂在于,你不可能穷举所有棋谱(量),你必须知道哪一步是废棋、哪一步是神之一手(质)。这种“知道怎么筛选、分类数据”的能力,被完美继承到了Gemini身上。相比之下,如果只是单纯地爬取全网数据进行训练,就像是一个死记硬背的学生,书读得再多,遇到新问题也容易“幻觉”。而Gemini更像是一个懂得挑书读、懂得去伪存真的学者。它知道垃圾数据不仅无用,甚至有害,所以它在学习之初就自带“过滤器”。这种对数据筛选质量的极致追求,才是通往更高阶智能的唯一路径。

说到底,无论是训练一个顶级的AI模型,还是培养一个优秀的学生,底层的逻辑竟然是惊人的一致。既然我们已经承认,给AI喂垃圾数据会把它带歪,甚至毁掉算力的潜能,那为什么在教育上,我们还在迷信“题海战术”和“死记硬背”呢?

w6.jpg

从以上对数据质量的讨论中,我们能得出一个关于教育的残酷真相:学习内容的质量,直接决定了一个人学习质量的高低。所谓的“培养学习能力”,不应该是指让学生像硬盘一样去存储海量的知识点,也不应该是指让他们像早期的矿机一样进行低效的重复计算。真正的学习能力培养,核心在于培养对数据的“审美”和筛选能力。如果一个学生每天接触的都是碎片化的教学内容,或者结构固定的知识,这些根本就是教育领域的预制菜文化,那么他的思维模型注定是低维度的、线性的成长而已。经典内容、重复教法,配上以升学结果为教育产品的营销模式,正迎合着家长们的线性理解能力的王牌组合。孩子们的大脑,置于这种教育环境中,即使10年寒窗以勤补拙,其实只是在习惯线性逻辑。他们失去的,则是在人生中搭建非线性思维的最佳时段。

非线性思维究竟是什么?就是我们熟悉的创造性、批判性思维。说创造性思维,让人不明白怎样创造。说批判性思维,又让人误解为就是否定和批判。说非线性思维,则让人稍稍看到思维的跳跃性内核,即剥离数据间的线性、习惯性规律,剩下的都是非线性的关联。这其中,那些少数的创新性规律,就会显得突出了。对,创新总是被习惯而淹没的。

回到文章题目《我说什么来着?》,我不只是在预言AI或比特币的走势,我是在强调一种基于数据质量的判断力。在这个信息爆炸、甚至信息泛滥的时代,谁能拥有像Gemini那样“剔除噪音、只取精华”的筛选本领,谁能在垃圾数据淹没世界之前找到那条高质量的数据通道,谁就是AI时代的赢家。

很可惜,从事教育行业久了,只能让我越来越鄙视这个行业的种种。课堂能呈现给孩子的引领性数据越来越少,更不会教给他们可以筛选数据质量的思考模型。考试根本没在考核学生的思维能力,甚至连备考的过程,也都是如“大力出奇迹”一样的刷刷刷刷刷题。

无论是做AI,炒币,还是读书育人,道理只有一个:AI时代,我们真正稀缺的,只是高质量的输入数据。

【编后话】

11月SAT的Curve出炉。做个数据更新。着放在今年整体考虑,它印证了我10月份讲座里预判,11月是较好的一次阅读拼分机会,但不是总分出分的机会不算好。

w7.jpg

w8.jpg

w9.jpg

一学就会的TOEFL、SAT、ACT、Essay课程,你感兴趣学吗?那就加一下Ava老师微信,咨询各期办班的时间。有10-30课时的SAT全理论课,也有10课时的ACT课,5课时的托福110+课。还有,新设计的每节2课时的单项主题SAT追分课,专为分分钟就赶考同学定制的生难词汇、科学推理、文学古文叙事、科学图表、题干选项逻辑、语法常失分项、和数学看解等七节课。另外,为文书季同学准备的3课时速成精要美本申请文书课,连你们的顾问们都想跟班上课,你只要三个小时,就能学会如何写出优秀的申请文书。
w10.jpg

最后的,最重要的

请关注我公号

我常常不说人话

因为人话都没什么用

有用的话

我才跟你们说

w11.jpg
-END-

w12.jpg
提高英语阅读能力缩短标化出分时间更多培训公告
排版|我偷的

文案|我撺的

图片|我抠的
Die von den Nutzern eingestellten Information und Meinungen sind nicht eigene Informationen und Meinungen der DOLC GmbH.
您需要登录后才可以回帖 登录 | 注册 微信登录

本版积分规则

Archiver|手机版|AGB|Impressum|Datenschutzerklärung|萍聚社区-德国热线-德国实用信息网

GMT+1, 2025-12-12 07:32 , Processed in 0.105335 second(s), 31 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表