目濡耳染网

春节梅城楼市回暖明显,车市升温

春节梅城楼市回暖明显,车市升温

北京疫情太严重了 14 2023年7月最新疫情

梅州一集体两作品获奖!广东省第十二届精神文明建设“五个一工程”组织工作先进单位和优秀作品名单公布

梅州一集体两作品获奖!广东省第十二届精神文明建设“五个一工程”组织工作先进单位和优秀作品名单公布

大连旅游必去景点 14 桂林旅游攻略

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  使用这种方法,推理成本没有明显提升,但是模型性能更好了。

  这么好用的模型,为啥不发布?

  不划算。

  semianalysis分析,相较于直接发布,Anthropic更倾向于用最好的模型来做内部训练,发布Claude 3.5 Sonnet就够了。

  这多少让人不敢相信。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  但是文章作者之一Dylan Patel也曾是最早揭秘GPT-4架构的人。

  除此之外,文章还分析了最新发布的o1 Pro、神秘Orion的架构以及这些先进模型中蕴藏的新规律。

  比如它还指出,搜索是Scaling的另一维度,o1没有利用这个维度,但是o1 Pro用了。

  网友:它暗示了o1和o1 Pro之间的区别,这也是之前没有被披露过的。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  新旧范式交迭,大模型还在加速

  总体来看,semianalysis的最新文章分析了当前大模型开发在算力、数据、算法上面临的挑战与现状。

  核心观点简单粗暴总结,就是新范式还在不断涌现,AI进程没有减速。

  文章开篇即点明,Scaling law依旧有效。

  尽管有诸多声音认为,随着新模型在基准测试上的提升不够明显,现有训练数据几乎用尽以及摩尔定律放缓,大模型的Scaling Law要失效了。

  但是顶尖AI实验室、计算公司还在加速建设数据中心,并向底层硬件砸更多钱。

  比如AWS斥巨资自研了Trainium2芯片,花费65亿美元为Anthropic准备40万块芯片。

  Meta也计划在2026年建成耗电功率200万千瓦的数据中心。

  很明显,最能深刻影响AI进程的人们,依旧相信Scaling Law。

  为什么呢?

  因为新范式在不断形成,并且有效。这使得AI开发还在继续加速。

  首先在底层计算硬件上,摩尔定律的确在放缓,但是英伟达正在引领新的计算定律。

  8年时间,英伟达的AI芯片计算性能已经提升了1000倍。

  同时,通过芯片内部和芯片之间的并行计算,以及构建更大规模的高带宽网络域可以使得芯片更好在网络集群内协同工作,特别是推理方面。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  其次在数据方面也出现了新的范式。

  已有公开数据消耗殆尽后,合成数据提供了新的解决途径。

  比如用GPT-4合成数据训练其他模型是很多实验团队都在使用的技术方案。

  而且模型越好,合成数据质量就越高。

  也就是在这里,Claude 3.5 Opus不发布的内幕被曝光。

  它承担了为Claude 3.5 Sonnet合成训练数据、替代人类反馈的工作。

  事实证明,合成数据越多,模型就越好。更好的模型能提供更好的合成数据,也能提供更好的偏好反馈,这能推动人类开发出更好的模型。

  具体来看,semianalysisi还举了更多使用综合数据的例子。

  包括拒绝采样、模式判断、长上下文数据集几种情况。

  比如Meta将Python代码翻译成PHP,并通过语法解析和执行来确保数据质量,将这些额外的数据输入SFT数据集,解释为何缺少公共PHP代码。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  比如Meta还使用Llama 3作为拒绝采样器,判断伪代码,并给代码进行评级。一些时候,拒绝抽样和模式判断一起使用。这种方式成本更低,不过很难实现完全自动化。

  在所有拒绝抽样方法中,“判官”模型越好,得到数据集的质量就越高。

  这种模式,Meta今年刚刚开始用,而OpenAI、Anthropic已经用了一两年。

  在长上下文方面,人类很难提供高质量的注释,AI处理成为一种更有效的方法。

  然后在RLHF方面,专门收集大量的偏好数据难且贵。

  对于Llama 3,DPO(直接偏好优化)比PPO(最近策略优化)更有效且稳定,使用的计算也少。但是使用DPO就意味着偏好数据集是非常关键的。

  如OpenAI等大型公司想到的一种办法是从用户侧收集,有时ChatGPT会给出2个回答并要求用户选出更喜欢的一个,因此免费收集了很多反馈。

  还有一种新的范式是让AI替人类进行反馈——RLAIF。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  它主要分为两个阶段。第一阶段模型先根据人类编写的标准对自己的输出进行修改,然后创建出一个修订-提示对的数据集,使用这些数据集通过SFT进行微调。

  第二阶段类似于RLHF,但是这一步完全没有人类偏好数据。

  这种方法最值得关注的一点是,它可以在许多不同领域扩展。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  最后,值得重点关注的一个新范式是通过搜索来扩展推理计算。

  文章中表明,搜索是扩展的另一个维度。OpenAI o1没有利用这个维度,但是o1 Pro用了。

  o1在测试时阶段不评估多条推理路径,也不进行任何搜索。

  Self-Consistency / Majority Vote就是一种搜索方法。

  这种方法中,只需在模型中多次运行提示词,产生多个相应,根据给定的样本数量,从相应中选出出现频率最高的来作为正确答案。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  除此之外,文章还进一步分析了为什么说OpenAI的Orion训练失败也是不准确的。

  本文作者:量子位,来源:量子位,原文标题:《反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练》

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

" alt="反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练" title="反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练">
井盖破损严重,市民急盼修复

井盖破损严重,市民急盼修复

杭州一日游最佳攻略 3 石家庄一日游最佳景点

索赔500万元!比亚迪法务部起诉博主“徐里里XlI”

  随后,比亚迪集团品牌及公关处总经理李云飞转发上述内容并评论称“比亚迪到了现在的位置和体量,如果有媒体就客观事实进行报道批评,都没问题!有些媒体不了解情况,有些误解性的发布,我们也能接受!但对于黑公关和黑媒体,为了黑而黑,长期针对比亚迪,诋毁比亚迪,我们绝不容忍,将一追到底,绝不姑息!”

  对于比亚迪法务部的起诉,“徐里里 Xll”在其微博上作出了回应。“我已收到比亚迪法务部的起诉通知。我自始至终没有删除任何一条微博,积极应诉。我希望大家可以光明磊落地走正常法律程序。而不是有组织地对我进行恶意抹黑制造证据、向活动举办方施压不让我出席参加活动等小手段刻意打压。”该用户表示。

" alt="索赔500万元!比亚迪法务部起诉博主“徐里里XlI”" title="索赔500万元!比亚迪法务部起诉博主“徐里里XlI”">
古尔曼预告苹果“革命性”突破,明年将发布自研Modem芯片

  新款modem将由台积电代工生产。古尔曼透露,为了iPhone SE的推出,苹果一直在发给员工的设备中秘密测试Sinope性能,还与全球多地的运营商合作伙伴一起进行质量保证测试。

  古尔曼写道,Sinope一开始不会用于苹果的高端手机产品,公司明年晚些时候将会推出一款新的中端iPhone,代号为“D23”,其设计会比目前的机型要薄得多,另会用在明年推出的低端iPad中。

  他解释道,modem芯片是一种风险很高的产品,如果不能正常工作,用户将遭遇通话中断、错过呼叫等情况。这意味着,苹果最高端、售价超过1,000美元的iPhone不能容忍这种情况。

  另一方面,Sinope还没有赶上高通部件的水平,不支持mmWave(毫米波)技术。相应地,Sinope将依赖于更广泛使用的Sub-6技术,这也是目前iPhone SE所用的技术。

  除此以外,Sinope‌将仅支持四载波聚合,高通的产品则可以同时支持六个或更多的载波。知情人士称,首款modem的下载速度上限约为每秒4 Gbps(合500MB/s),虽低于高通的速度,但客户在日常使用中可能不会注意到差异。

  无论如何,苹果首款modem将具有其他几项优势:可与苹果的主处理器紧密集成减少功耗,更高效地扫描蜂窝服务,更好地支持与卫星网络的连接。

  另还能够相对于SAR(比吸收率)限制提供更好的性能。SAR是衡量身体吸收射频辐射的指标,美国联邦通信委员会等政府机构对其可接受水平有规定。

  苹果还计划支持DSDS(双SIM卡双待),允许用户在使用双号码时实现两个SIM卡的数据连接。

  到2026年,苹果希望其第二代调制解调器“Ganymede”能更接近高通的能力:Sub-6载波聚合支持6个载波,毫米波载波聚合支持8个载波,速度达6 Gbps。Ganymede预计将在2026年将进入iPhone 18系列,到2027年进入高端iPad。

  到2027年,苹果的目标是推出代号为“Prometheus”的第三代modem,凭借性能和人工智能功能超越高通,还将支持下一代卫星网络。更进一步,苹果正在讨论将其modem和主处理器合并为单一组件的可能性。

" alt="古尔曼预告苹果“革命性”突破,明年将发布自研Modem芯片" title="古尔曼预告苹果“革命性”突破,明年将发布自研Modem芯片">