OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文 ...
架构迭代升级的确定性,是国产芯片对抗外部不确定性的定海神针。在历经苏堤、春晓、曲院、平湖四代量产演进的积淀后,摩尔线程计划于明年正式量产第五代架构「花港」。 摩尔线程通过底层指令集升级来换取性能空间优化,花港在同等工艺条件下实现了 50% ...
这项由Perfecxion.ai公司的Scott Thornton领导的研究于2025年12月发表在arXiv预印本服务器上,论文编号为arXiv:2512.18542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。
顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异,但在真正高难度问题面前仍未满分,显示出推理能力仍有提升空间。与此同时,AI推理能力和强化学习的进步让增长速度几乎翻倍,成本大幅下降,许多模型已能在消费级硬件上运行。
MiniMax-M2.1 在 VIBE 综合榜单中表现卓越,以平均 88.6 分的成绩展现了接近Claude Opus 4.5的全栈构建能力,并在几乎所有子集上都显著优于Claude Sonnet 4.5。 很多模型都是能写 Java,也能写 ...
这两天,科技圈和金融圈的朋友圈被 MiniMax 赴港上市的消息刷屏。作为大模型领域的明星独角兽,MiniMax 的“上岸”无疑给行业投下了一颗深水炸弹。 但比起资本市场的喧嚣,作为开发者,我更关心其产品底层实力的进化。
在刚刚结束的2025亚马逊云科技re:Invent中国行北京站中,这家全球云计算的领军者给出了一份极具份量的答卷。作为一个年收入超过1320亿美元、在如此巨大体量下依然保持20%同比增长的超级平台,亚马逊云科技没有选择回避当下的泡沫论,而是用工程化思 ...
字节跳动旗下Seed团队近日宣布,其研发的新一代形式化数学推理模型Seed Prover 1.5正式发布。该模型通过引入创新的Agentic架构与大规模强化学习训练方法,在多项高难度数学评测中取得突破性进展,刷新了形式化数学推理领域的性能纪录。 在备受瞩目的国际数学奥林匹克(IMO 2025)模拟测试中,Seed Prover 1.5展现出强大实力。模型仅用16.5小时便完成前5道赛题的完整形式化 ...
IT之家 12 月 23 日消息,TIOBE 指数 2025 年 12 月排行榜现已在官网公布,这个月 Python 依旧稳如泰山,以 23.64% 的市场份额夺得冠军,而 C 语言则是从上月的第 4 名升至亚军,市场份额 10.11%,C++ 语言也从上月的亚军跌至季军,份额为 8.95%。 值得注意的是,Java 在本月跌出前三,市场份额 ...
这项由NVIDIA公司Wei Du、Shubham Toshniwal等研究团队开展的突破性研究于2025年12月发表在arXiv预印本平台,论文编号为arXiv:2512.15489v1。该研究构建了迄今为止最大规模的数学推理数据集Nemotron-Math,包含高达7500万条数学解题推理轨迹,让AI模型在数学竞赛中达到了前所未有的100%满分成绩。 要理解这项研究的重要性,我们可以把AI学数 ...
这项由麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的程可盈(Ellie Y. Cheng)、洛根·韦伯(Logan Weber)、金天(Tian Jin)和迈克尔·卡宾(Michael Carbin)等人完成的研究,发表于2025年的arXiv预印本平台。有兴趣深入了解的读者可以通过论文编号arXiv:2512.14805查询完整研究。 当你用自然语言告诉计算机"把这个图表中的数据 ...
自教育部2020年发布《新文科建设宣言》以来,国内高校纷纷开设跨学科、跨专业新兴交叉课程、多学士学位,推动文科与理工农医的交叉融合。近两年,不少高校都推出了“文科+AI”、AI辅修、AI类微专业等,南开大学今年首次试点跨学科辅修制度,将辅修专业修读纳 ...