目濡耳染网

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  使用这种方法,推理成本没有明显提升,但是模型性能更好了。

  这么好用的模型,为啥不发布?

  不划算。

  semianalysis分析,相较于直接发布,Anthropic更倾向于用最好的模型来做内部训练,发布Claude 3.5 Sonnet就够了。

  这多少让人不敢相信。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  但是文章作者之一Dylan Patel也曾是最早揭秘GPT-4架构的人。

  除此之外,文章还分析了最新发布的o1 Pro、神秘Orion的架构以及这些先进模型中蕴藏的新规律。

  比如它还指出,搜索是Scaling的另一维度,o1没有利用这个维度,但是o1 Pro用了。

  网友:它暗示了o1和o1 Pro之间的区别,这也是之前没有被披露过的。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  新旧范式交迭,大模型还在加速

  总体来看,semianalysis的最新文章分析了当前大模型开发在算力、数据、算法上面临的挑战与现状。

  核心观点简单粗暴总结,就是新范式还在不断涌现,AI进程没有减速。

  文章开篇即点明,Scaling law依旧有效。

  尽管有诸多声音认为,随着新模型在基准测试上的提升不够明显,现有训练数据几乎用尽以及摩尔定律放缓,大模型的Scaling Law要失效了。

  但是顶尖AI实验室、计算公司还在加速建设数据中心,并向底层硬件砸更多钱。

  比如AWS斥巨资自研了Trainium2芯片,花费65亿美元为Anthropic准备40万块芯片。

  Meta也计划在2026年建成耗电功率200万千瓦的数据中心。

  很明显,最能深刻影响AI进程的人们,依旧相信Scaling Law。

  为什么呢?

  因为新范式在不断形成,并且有效。这使得AI开发还在继续加速。

  首先在底层计算硬件上,摩尔定律的确在放缓,但是英伟达正在引领新的计算定律。

  8年时间,英伟达的AI芯片计算性能已经提升了1000倍。

  同时,通过芯片内部和芯片之间的并行计算,以及构建更大规模的高带宽网络域可以使得芯片更好在网络集群内协同工作,特别是推理方面。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  其次在数据方面也出现了新的范式。

  已有公开数据消耗殆尽后,合成数据提供了新的解决途径。

  比如用GPT-4合成数据训练其他模型是很多实验团队都在使用的技术方案。

  而且模型越好,合成数据质量就越高。

  也就是在这里,Claude 3.5 Opus不发布的内幕被曝光。

  它承担了为Claude 3.5 Sonnet合成训练数据、替代人类反馈的工作。

  事实证明,合成数据越多,模型就越好。更好的模型能提供更好的合成数据,也能提供更好的偏好反馈,这能推动人类开发出更好的模型。

  具体来看,semianalysisi还举了更多使用综合数据的例子。

  包括拒绝采样、模式判断、长上下文数据集几种情况。

  比如Meta将Python代码翻译成PHP,并通过语法解析和执行来确保数据质量,将这些额外的数据输入SFT数据集,解释为何缺少公共PHP代码。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  比如Meta还使用Llama 3作为拒绝采样器,判断伪代码,并给代码进行评级。一些时候,拒绝抽样和模式判断一起使用。这种方式成本更低,不过很难实现完全自动化。

  在所有拒绝抽样方法中,“判官”模型越好,得到数据集的质量就越高。

  这种模式,Meta今年刚刚开始用,而OpenAI、Anthropic已经用了一两年。

  在长上下文方面,人类很难提供高质量的注释,AI处理成为一种更有效的方法。

  然后在RLHF方面,专门收集大量的偏好数据难且贵。

  对于Llama 3,DPO(直接偏好优化)比PPO(最近策略优化)更有效且稳定,使用的计算也少。但是使用DPO就意味着偏好数据集是非常关键的。

  如OpenAI等大型公司想到的一种办法是从用户侧收集,有时ChatGPT会给出2个回答并要求用户选出更喜欢的一个,因此免费收集了很多反馈。

  还有一种新的范式是让AI替人类进行反馈——RLAIF。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  它主要分为两个阶段。第一阶段模型先根据人类编写的标准对自己的输出进行修改,然后创建出一个修订-提示对的数据集,使用这些数据集通过SFT进行微调。

  第二阶段类似于RLHF,但是这一步完全没有人类偏好数据。

  这种方法最值得关注的一点是,它可以在许多不同领域扩展。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  最后,值得重点关注的一个新范式是通过搜索来扩展推理计算。

  文章中表明,搜索是扩展的另一个维度。OpenAI o1没有利用这个维度,但是o1 Pro用了。

  o1在测试时阶段不评估多条推理路径,也不进行任何搜索。

  Self-Consistency / Majority Vote就是一种搜索方法。

  这种方法中,只需在模型中多次运行提示词,产生多个相应,根据给定的样本数量,从相应中选出出现频率最高的来作为正确答案。

反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练

  除此之外,文章还进一步分析了为什么说OpenAI的Orion训练失败也是不准确的。

  本文作者:量子位,来源:量子位,原文标题:《反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练》

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

" alt="反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练" title="反转!Claude 3.5超大杯没有训练失败,最新爆料:内部自留,用于合成数据和RL训练">
华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

微博博主“曾子言”表示,“华为店里打电话过来说了,我预约的Mate 70 Pro+可以用国补,让我记得领资格”。

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

小红书上一位用户称,12月4日南京线下门店Mate 70系列开售,参加国补。

该用户表示,南京华为官方旗舰店不参与国补(咨询回复理由:官方旗舰店总部在深圳),南京地区华为授权体验店参加国补,但是需要本人带着身份证去现场购买。

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

需要注意的是,根据江苏3C数码补贴规则,消费者每人每类产品限购一件,实行实名制管理,并且手机、平板电脑等易变现电子产品需现场拆盒激活,留存激活照片(照片要求清晰展示激活设备的SN 码、IMEI码,包装盒的SN 码,购物小票或个人普通发票(需标明机器型号)和激活日期,以上相关信息均需保持一致),上传平台,以备审计。

华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

" alt="华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!" title="华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!">
36034994586981美元!美国国债总额再创新高

  联邦预算问责委员会主席马娅·麦吉尼亚斯在发言稿中直言:“如今,美国政府借款正变得像季节的变化一样规律而确定。”

36034994586981美元!美国国债总额再创新高

  不过马娅·麦吉尼亚斯的说法显然有缺漏,虽然美债的增长确实如季节更替一般必然,但它当下增长的速度却远比规律的季节更替快得多。

  增长1万亿 从大半年到3个月 增速越来越快

  美国财政部公布的数据显示,2024年1月初美债总额达到34万亿,35万亿的数字出现在今年7月底,间隔约7个月。但从7月底的35万亿到现在的36万亿,这一万亿美债的增长只用了约3个月,美债增速显然在加快。

36034994586981美元!美国国债总额再创新高

  △美国财政部下属的财务数据网站披露的数据显示,美国国债总额从2014年的23.64万亿美元升至2024年的超36万亿美元,涨幅超52%,这一趋势整体上仍在持续加快。

  根据俄罗斯卫星通讯社的测算,第35万亿美元美债是在211天内以平均每天0.014%的速度形成的,那么第36万亿美元已经以每天0.025%的速度增长。换算下来,按当下美债增长的速度,每24小时美债总额都会增加87亿。

  所以,相较于美债变化的趋势,马娅·麦吉尼亚斯所描述的季节更替一样的规律性,可能更多是指美国政府永远改变不了的“寅吃卯粮”的陋习。这种举债度日的陋习会一直持续到美债被堆高到一个天文数字,积重难返,纵使美联储有心缩表、减持美债,也于事无补。

  为抗通胀加息缩表 却为偿债上难度

  自2022年6月,为应对居高不下的通胀,美联储进行了一揽子加息缩表计划后,美债利率进而上升,反倒增大了美国政府的偿债成本,再次推高美债水平。

36034994586981美元!美国国债总额再创新高

  根据美国财政部11月20日公布的数据,2024年美国联邦政府仅用以偿还美债利息的支出就达到了8820亿美元。相较2023年6590亿美元的利息支出,2024年美债利息支出增长率达33.8%。

  联邦政府停摆风险、债务上限接踵而来

  此外,于今年9月在美国国会通过的短期拨款法案即将于12月20日到期,美国国会必须在未来一个月里利用仅有的约20个工作日采取新的立法行动,为联邦政府继续运转提供资金,否则政府将因无钱可用而部分停摆。

36034994586981美元!美国国债总额再创新高

  12月20日前,美国两党的议员们将继续就能否拨款维系政府运作继续上演一场事关美国两党政府“关门”的大戏。

  而在2025年初,由美国国会投票通过的暂缓美国政府债务上限生效的法案也将到期。届时,正逢美国民主与共和两党的两任总统交接工作的时期,二者又将各自祭出何种手段避免美国面临债务违约,又是否会再上演互相拆台的戏码,仍然备受关注。

36034994586981美元!美国国债总额再创新高

  不过,正如美国独立研究机构联邦预算问责委员会主席马娅·麦吉尼亚斯对美国国债的描述一样,两党间的撕扯与注定持续上涨的美国国债数额一样,都像季节的变化一样规律而确定。

  ©2024中央广播电视总台版权所有。未经许可,请勿转载使用。

36034994586981美元!美国国债总额再创新高

" alt="36034994586981美元!美国国债总额再创新高" title="36034994586981美元!美国国债总额再创新高">

36034994586981美元!美国国债总额再创新高

中国十大留学中介排名 32256 0基础学化妆

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  来源:紫金天风期货研究所

  【20241128】专题:美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  核心观点

  随着美国总统的大选落定,特朗普政府的重返无疑将对我国对外出口,尤其是对美国的出口造成新一轮的挑战。在竞选期间,特朗普曾承诺对所有进口商品征收10%至20%的广泛关税,并威胁取消中国最惠国待遇,对中国进口产品征收超过60%的关税。特别地,针对中国转口贸易的关键地区之一——墨西哥,特朗普政府计划额外征收25%的关税。

  总体而言,当前的转口贸易格局中,东盟国家占据主导地位,墨西哥紧随其后。交通运输设备、汽车及其零部件,以及钢铁、铝及其制品等行业将首先受到较大影响。针对墨西哥地区加征关税的措施,可能会促使中国企业寻求其他国家作为转口贸易的新渠道,或直接在美国本土建立工厂以规避关税壁垒。根据特朗普政府的关税政策,仅墨西哥方面的出口变动对中国总出口量的影响可能达到0.64%左右。

  正文

  在2017年中美贸易战后,中国对美国出口的路径经历了显著变化,东盟、墨西哥、印度以及中国台湾地区成为了中国出口美国的主要中转地。所谓转口贸易,指的是货物不是直接从原产地运送到目的地,而是先经过其他国家或地区进行转运或轻微加工的一种贸易形式,这样做的目的是为了利用这些国家或地区的贸易政策来降低成本和税收。通过对贸易量数据的分析,我们发现在中美贸易紧张关系加剧之后,中国对东盟、墨西哥、印度和中国台湾地区的出口以及美国从这些地区进口的份额都出现了明显的同步增长,并且这种变化显示出较高的相关性,表明这些地区是中国重要的转口贸易区域。特朗普政府在赢得美国大选后,提到的关税政策相较于2017年更加不利于我国出口,其中包括:取消中国最惠国待遇;对所有进口商品征收10%的关税等。也就是大家熟称的“60%+10%”。

  从实际操作来看,特朗普政府第二个任期的关税思路仍旧沿用了第一任期的贸易保护主义思路,即加征高额关税,从而推动美国制造业回流的路径。对华关税政策将比上一个任期更加强硬。但是幅度、范围和时间点目前存在争议。市场现在一致认为,特朗普政府首先会发起贸易调查,类似于上一任期内的201条款(针对全世界洗衣机和太阳能电池板关税),232条款(针对大部分国家钢材和铝关税)和301条款(共计4轮对华关税名单)。其次就是取消我国最惠国待遇。由于这个方案需要过参议院和众议院半数投票,因此所需时间较长,但加税幅度较大,目前最惠国平均税率为3.4%,非最惠国税率为32%。叠加301条款的税率,合计我国加征的关税将超过60%。

  图1 301关税条款加征物品清单

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  从当前转口贸易的规模来看,东盟和墨西哥处于领先地位。墨西哥在中国出口中的占比在2023年达到了2.39%,相较于贸易战前增长了约0.87%;同时,美国从墨西哥的进口占比也增长了1.58%,年均增速在四个地区中是最高的。这些数据表明,墨西哥在中国对美转口贸易中扮演着越来越重要的角色,同时也反映了中美贸易摩擦对中国出口流向和结构的影响。

  图2 中国出口各个地区金额

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  图3 美国进口各个地区金额

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  具体来看,转口贸易涉及的品类中,电子产品、集成电路、纺织类产品和钢铁产品等比重较高。这些产品中,电子产品因其高附加值特性,常常成为美国反倾销、反补贴调查的对象。而纺织类产品和轻工产品则因生产过程中需要大量低成本劳动力,而东盟地区凭借其密集且成本较低的劳动力优势,有效降低了生产成本。

  近两年的数据显示,墨西哥从中国进口规模的增速与美国从墨西哥进口的增速呈现出同步上涨的趋势,这一现象进一步验证了转口贸易模式的实际运作。墨西哥因其地理位置靠近美国、劳动力成本较低以及拥有较为完善的工业基础和基础设施,成为转口贸易的重要节点。此外,墨西哥与多个国家和地区签订的自由贸易协定,也为其成为转口贸易优选地提供了政策支持。

  图4  中墨出口和墨美出口增速

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  墨西哥相较于东盟国家,不仅拥有丰富的自然资源,还具备一个相对完整且多样化的制造业体系。这一体系涵盖了从食品、纺织、制革等轻工业到汽车、钢铁、化工等重化工业。尤为重要的是,墨西哥在2019年5月的232法案中获得了美国对其钢铁和铝产品关税的豁免,这为墨西哥相较于东盟国家的轻工业产品,提供了更多重工业品如汽车、钢材及其制品等进入美国市场的机会。

  从海关数据来看,中美贸易战前后,美国从中国和墨西哥的进口比例变化中,钢铁、铝、橡胶及其制品,以及车辆及其配件的增速尤为显著。特别是钢铁、铝及其制品和车辆及其配件这三大类商品,中国的出口增速达到了约20%。这些品类由于关税而减少出口至美国的部分,正逐渐被墨西哥通过转口贸易所替代。近两年来,墨西哥从中国进口规模的增速与美国从墨西哥进口的增速呈现出同步上涨的趋势,在中美贸易差额上,墨西哥转口贸易正在逐步填平缺口。

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?

  如果特朗普政府确实对加拿大和墨西哥两国实施了25%的额外关税,并结合之前提出的对所有进口商品普遍加征10%关税的提议,我国商品进入美国市场的平均关税水平可能会超过30%。这一水平基本与贸易战期间我国出口至美国商品的平均关税率持平。因此,在短期内,我国通过利用美国关税“低洼”国家进行出口的策略也将遭遇一定程度的阻碍。根据历史海关数据的分析,我国向墨西哥转口的货物将失去价格优势,这部分出口占我国总出口量的大约0.64%。

  从长远来看,特朗普政府重返白宫后,全球经济贸易的不确定性将进一步增加,中美贸易关系的脱钩趋势愈发明显,对于那些中国依赖度较低的产品出口,其影响可能会进一步加剧。这要求我国企业在出口策略上进行相应的调整,以适应不断变化的国际贸易环境,增强抵御国际贸易风险的能力。

  但是结合往期的数据来看,特朗普政府加税的水分还是存在的。在上轮特朗普政府增表示将对中国出口美国的产品征收45%的关税,最终落地的4个清单中加征的关税最高不超过25%,最终的总税率来到了19.3%。因此我们认为此次加征关税至60%的概率并不大。且美国本轮加税最大的制约在国内的通胀水平,关税政策对于增长和就业的效应为负,同时会有一定的通胀效应,关税条款固然有利于美国部分国内的企业,但中美贸易的脱钩,主要代价是有美国消费者承担。

  我国面对特朗普政府的关税威胁,最有可能的反制措施直指美国的通胀等经济问题作为谈判筹码;另一方面我们可以进一步发展供应链的优势,争取更多的利益。天下熙熙皆为利来,天下攘攘皆为利往。

  作者:贾瑞斌

  从业资格证号:F3041932

  交易咨询证号:Z0015195

" alt="【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?" title="【专题】美国对墨西哥加征关税,会对中国的贸易产生多大的影响?">