北京时间11月11日,人工智能初创公司月之暗面Kimi CEO杨植麟等人在社交平台Reddit上解答网友提问 ,回应关于模型训练成本等问题。
Kimi近半年时间持续投入开源模型的研发与更新 。11月6日发布了最新版本的开源思考模型Kimi K2 Thinking。彼时有消息称,Kimi K2 Thinking的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元。
针对该数据 ,杨植麟在此次对话中回应称:(460万美元)不是官方数字,由于大部分投入都花在研究与实验上,因此训练成本很难量化 。
网友也提出Kimi K2 Thinking推理长度过长、榜单成绩与实际体验不符等质疑,杨植麟表示现阶段该模型优先考虑绝对性能 ,token效率会在后续得到改善,榜单高分与实测的脱节问题也会在模型通用能力得到补齐后被逐渐消解。
当下,越来越多的中国开源大模型在国际市场中被调用。记者搜索OpenRouter模型调用榜单 ,最新一周内,排名前二十名的模型产品中,中国开源模型产品占五席 ,具体包括MiniMax M2 、DeepSeek V3、GLM4.6、DeepSeek V3.1 、DeepSeek V3.2 Exp。Kimi因OpenRouter平台接口问题,目前只能以API形式被使用 。
持续的模型更新与庞大训练量需要算力资源支持,Kimi团队表示所使用的芯片是携带InfiniBand(一种面向高性能计算和AI训练的网络互连技术)的H800 GPU ,性能虽然比不上美国的高端卡,数量也处于劣势,但每张卡都被用到了极致。
整体来看 ,月之暗面Kimi未来很长一段时间内仍将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化。在优先文本模型前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,通过架构创新、开源策略与成本控制尝试建立差异化优势 。
(文章来源:第一财经)
配资炒股给股票:线上股票配资有哪些-十大券商策略:赚钱效应累积 水牛特征浮现!仍有“低位资产”值得挖掘
普通人如何加杠杆炒股:国内知名股票配资公司有哪些-伊警告以:再袭击将不设“红线”!马克龙威胁“报复”伊朗
十大杠杆炒股平台:股票杠杆是指什么-旺季不旺10月猪企“增量不增价”高成本猪企亏损加剧
线上配资开户论坛:炒股十倍的杠杆软件有哪些-白宫经济顾问:美国10月就业报告会如期发布 但不含失业率数据
炒股配资平:a股开户可以买哪些股票-美股三大指数集体收跌 贵金属板块逆势大涨
配资炒股的投资策略:股票加了杠杆啥意思-两融余额连续12周增长 融资客大手笔扫货名单出炉
证券配资最简单最准方法:最安全的杠杆炒股平台有哪些呢-两艘超级油轮紧急掉头 油运运费大涨 高盛:油价恐上涨47%!港口股、军工股大涨
天盛优配提示:文章来自网络,不代表本站观点。
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
据央视新闻报道,在3月23日举行的中国发展高层论坛2025年年会上,中央财经委员会办公室分管日常工作的副主任、中央农村工...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
沪深两市成交额连续第44个交易日突破1万亿,较昨日此时缩量超900亿。...