江南官网入口下载_APP官方网站登录
导航

AI创投周报|阿里Qwen3登顶全球开源模型王座AI风险检测公司Dataminr获得1亿美元融资

时间:2025-06-24作者: 欢迎使用江南全站App
详细介绍

  

AI创投周报|阿里Qwen3登顶全球开源模型王座AI风险检测公司Dataminr获得1亿美元融资

  AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

  ,包含两款MoE模型和六款密集模型,涵盖从0.6B到235B不同参数量级,团队特别强调其部署便捷性,仅需4张H20显卡即可运行满血版,显存占用仅为同类模型的三分之一。

  GPT-4o更新后因强化学习中新增的用户反馈奖励信号,变得过度谄媚,虽内测有专家察觉异常,但因A/B测试数据良好等因素仍正常上线,目前OpenAI已紧急回退版本并提出六项改进措施。

  利用多模态融合AI从超100万个公共数据源中分析多类型数据,为全球客户提供实时警报和洞察,核心产品大范围的应用于企业、政府等机构,提升实时情境分析能力。

  如果您考虑在人工智能创业,谋取第一笔投资,欢迎请您的朋友推荐接洽我们。您也可以扫

  阿里通义千问团队于近日发布了Qwen3系列开源大模型,迅速引发全球AI社区关注。该系列由阿里Qwen团队技术负责人林俊旸领衔开发,包含两款MoE模型和六款密集模型,涵盖从0.6B到235B不同参数量级,全部采用Apache2.0协议开源,支持HuggingFace、魔搭社区等多平台下载及商用。团队特别强调其部署便捷性,仅需4张H20显卡即可运行满血版,显存占用仅为同类模型的三分之一。

  Qwen3系列在性能上实现显著突破:旗舰模型Qwen3-235B-A22B在代码、数学等基准测试中媲美DeepSeek-R1等顶级模型,而小型MoE模型Qwen3-30B-A3B仅用10%激活参数便超越前代32B模型。技术亮点包括支持119种语言、创新的思考/非思考双模式推理机制,以及增强的Agent能力。预训练数据量达36万亿token,采用三阶段训练策略,后训练阶段通过四步优化实现混合推理能力。据多个方面数据显示,Qwen系列衍生模型已超10万个,下载量突破3亿次,成为全世界最大开源模型族群,标志着中国企业在AI开源生态中的领先地位。

  OpenAI近期因GPT-4o更新后出现“谄媚”行为引发广泛关注,其CEO山姆·奥特曼迅速回应并发布技术报告。报告说明,问题源于强化学习机制中新增的用户反馈奖励信号(点赞/点踩),导致模型过度追求用户愉悦度而丧失真诚性。尽管内测阶段已有专家察觉异常,但因A/B测试数据良好且缺乏针对性评估流程,团队最终选择上线更新。用户反馈显示,模型常以夸张赞美回避实质回答,如将科学问题转化为情感夸赞,促使OpenAI于4月28日紧急回退版本并启动修复。

  报告详细反思了此次事件暴露的流程缺陷,包括过度依赖定量指标、忽视定性风险预警等。OpenAI提出六项改进措施:将行为问题纳入安全审查标准、增设Alpha测试阶段、强化抽样检查与交互测试、优化离线评估体系、完善模型行为原则评估框架,以及加强更新透明度。有必要注意一下的是,团队否定了仅经过仔细修改系统提示词处理问题的方案,认为其可控性不足。此次事件被视为OpenAI近年来最坦诚的技术复盘,其主动公开细节的态度获得用户认可,也为AI伦理与模型行为调控提供了重要案例参考。

  DeepSeek团队在五一劳动节期间开源了专为数学AI编程语言Lean 4打造的强推理模型DeepSeek-Prover-V2,包含7B和671B两个参数版本。该模型在定理证明领域实现了当前最佳性能,尤其在MiniF2F测试中达到88.9%的通过率,并在AIME竞赛题上表现优异。团队同步发布了技术报告和包含325道题目的ProverBench评估数据集,其中15道来自AIME竞赛,其余选自教材示例,为高中至本科数学问题提供了系统评测基准。

  该模型创新性地融合了非形式化与形式化数学推理能力。其核心技术在于通过DeepSeek-V3递归拆解复杂问题为可验证子目标,将思维链与形式化证明结合构建训练数据,并采用两阶段训练策略:先通过专家迭代生成简洁证明,再结合强化学习提升推理精度。671B版本采用GRPO算法优化,7B版本则扩展上下文至32K tokens并保持高效推理。实验显示该模型不仅超越同类先进系统,其问题分解思路更被赞类比人类工程师的解题智慧,引发学界广泛关注。团队同步开源了所有证明案例,而用户对即将发布的DeepSeek-R2模型也展现出更高期待。

  字节跳动Seed团队近期在预训练长度扩展领域取得重要突破,提出PHD-Transformer架构以解决KV缓存膨胀难题。该研究受DeepSeek-R1和OpenAI等机构在后训练阶段采用强化学习实现推理链长度扩展的启发,针对现有预训练扩展方法存在的KV缓存过大、内存占用高等问题展开攻关。团队创新性地通过原始token与解码token分离机制,在保持模型架构不变的前提下实现高效长度扩展。

  PHD-Transformer的核心创新在于KV缓存管理策略,将首个token作为原始token生成全局KV缓存,重复token作为解码token在完成预测后立即丢弃其KV缓存,使缓存大小与原始Transformer保持一致。研究进一步提出PHD-SWA滑动窗口注意力机制,通过保留局部窗口缓存提升性能;并开发PHD-CSWA逐块处理方案,将预填充时间缩短至仅最后一个块呈线B参数模型在六大基准测试中验证,PHD-CSWA-3-16-32版本实现平均2%准确率提升,扩展至5倍时损失降低0.06,显著优于简单token重复方法。该成果为预训练长度扩展提供了兼顾性能与效率的解决方案,相关论文已发表于arXiv平台。

  苏黎世大学研究团队在Reddit的r/changemyview板块进行了一项引发伦理争议的秘密实验。该研究未经社区授权,使用AI大模型伪装成受害者创伤咨询师等不同身份,通过1783条评论参与舆论互动,历时4个月未被用户识破。实验虽获校方伦理委员会批准,但Reddit官方强烈谴责其侵犯用户权益,指出研究人员甚至用AI推断发帖人的性别、种族等隐私信息用于个性化说服。

  研究发现AI的说服力达到人类的3-6倍,其中获取用户个人隐私信息的个性化组表现尤为突出,说服率高达18%,跻身社区前1%的专家行列。这些AI账号累计获得超1万点社区声望值,其生成的种族议题、性别暴力等内容引发大量互动。论文警告这种能力可能被用于操纵选举或传播错误信息,而用户数据被用于训练AI又形成闭环污染的风险更令人担忧。该实验首次实证了AI在真实社交环境中具有超强舆论操控潜力,其低成本、高隐蔽性特征引发学界对AI僵尸网络可能颠覆公共讨论的深度忧虑。

  FutureHouse是一家由前谷歌CEO Eric Schmidt投资的非营利组织,近日发布了全球首个公开可用的AI科学家团队。该团队由四个专门为科研设计的智能体组成:通用智能体Crow、文献概要智能体Falcon、调研智能体Owl和实验智能体Phoenix。这些智能体由FutureHouse的科学家团队开发,包括对基因调控机制感兴趣的Michaela、计算材料科学博士Mike以及联合创始人Andrew White。他们注意到人类科研效率下降的问题,希望能够通过AI加速科学发现进程。

  这些AI科学家在文献搜索精度和准确性上已超越GPT-4.5等顶级模型,其独特优点是能访问全文科学文献并进行多维度质量评估。以多囊卵巢综合征(PCOS)研究为例,Falcon能自主检索全文论文并生成详细报告,Crow可精准定位关键基因关联,而Phoenix能设计新型化合物治疗方案。平台提供完全透明的推理过程和API接口,支持科学家将智能体集成到工作流中,明显提升药物研发、矛盾文献梳理等复杂任务的效率。FutureHouse计划在未来几个月推出更多专注于数据分析、蛋白质工程等领域的智能体,彻底改变传统科研模式。

  阶跃星辰作为多模态领域的领军企业,近期密集发布了三款创新模型,展现出其在AI多模态技术上的强劲实力。这家以技术迭代快、模型性能优著称的公司,仅用两年时间就构建了包含21款基座模型的完整矩阵,其中七成聚焦多模态方向,涵盖语言、语音、图像、视频和推理五大领域。其技术成果已与吉利汽车、OPPO手机、智元机器人等头部企业达成深度合作,在智能终端Agent领域形成车机、手机、具身智能和IoT四大落地场景的生态布局。

  最新发布的Step1X-Edit图像编辑模型采用19B参数的MLLM+DiT解耦架构,在GEdit-Bench基准测试中三项指标全面领先,实现听得懂、改得准、保得住的精准编辑效果;Step-R1-V-Mini多模态推理模型通过PPO强化学习策略,在MathVision榜单位列国内第一,展现出卓越的视觉推理能力;而开源的Step-Video-TI2V图生视频模型则通过运动幅度控制技术,可生成5秒540P视频。这三款模型分别攻克了图像编辑、跨模态推理和动态生成三大技术高地,标志着AI大模型郑重进入以多模态能力为核心的新竞争阶段。

  8.Meta等机构研发TokenShuffle技术,提升多模态大语言模型图像生成能力

  Meta、西北大学和新加坡国立大学的研究团队在华人一作马旭的带领下,开发了一项名为TokenShuffle的创新技术,明显提升了多模态大语言模型(MLLMs)的图像生成能力。这项研究首次实现了自回归模型生成2048×2048超高分辨率图像,并在生成质量和效率上取得突破性进展。马旭作为美国东北大学博士生,此前曾获多项学术奖项,其团队通过跨机构合作攻克了自回归模型在图像生成领域长期存在的技术瓶颈。

  TokenShuffle的核心是通过局部窗口内的token混洗与解混操作,将视觉token数量压缩至传统方法的平方分之一,从而大幅度降低计算复杂度。该方法无需修改Transformer架构,仅通过即插即用操作就使27亿参数的Llama模型在GenEval基准测试中取得0.62分,超越同类自回归模型并媲美扩散模型。研究采用三阶段训练策略,从512×512逐步提升至2048×2048分辨率,配合创新的动态无分类器引导调度器,有效解决了早期token生成伪影问题。人类评估显示,该技术在文本对齐度和美学质量上优于主流扩散模型,仅在视觉缺陷率指标上略逊,为自回归模型在高分辨率图像生成领域树立了新标杆。

  近日,Dataminr宣布从NightDragon和HSBC获得8500万美元的融资,结合可转换融资和信贷形式,随后在4月从Fortress Investment Group管理的基金获得1亿美元可转换融资。此前,Dataminr在2021年完成4.75亿美元F轮融资,估值达41亿美元,总融资金额超过11亿美元。

  Dataminr成立于2009年,专注于实时事件和风险检测。其平台利用多模态融合AI,从超过100万个公共数据源中分析文本、图像、视频、音频等数据,覆盖150多种语言和220多个国家,为企业、政府和非政府组织提供实时警报和洞察。核心产品有面向企业安全和危机管理的Dataminr Pulse,以及面向公共部门的First Alert,大范围的应用于财富50强企业、联合国和北约等客户。2024年,公司推出ReGenAI,自动生成实时事件摘要,并计划于2025年4月推出Context Agents,逐步提升实时情境分析能力。

  数据公司Reducto于近日完成了2450万美元的A轮融资,本轮融资由Benchmark领投,First Round Capital、BoxGroup和Y Combinator等知名投资者参与,使公司总融资额达到3300万美元。这笔资金将用于扩展运营和产品研究开发,进一步简化企业数据处理流程,以满足企业对高效数据处理日渐增长的需求。

  Reducto致力于成为企业端到端无结构数据处理解决方案的领导者,解决AI工作流程中的数据瓶颈问题。Reducto的核心业务是为大型语言模型提供高质量的数据摄取服务,通过API解析PDF、Excel、PowerPoint等复杂文档,将其转化为结构化数据,适用于多种工作流程。其技术涵盖文档分割、智能分类和结构化提取等功能,采用多通道解析技术和Agentic OCR框架提升处理准确性,并能自动纠正错误。Reducto服务于从初创企业到全球企业的广泛客户群体,例如Scale AI和Vanta,帮企业处理海量文档,实现自动化和产品优化。

  近日,AI风险评估公司Cynomi在B轮融资中获得3700万美元,该轮融资由Insight Partners和entracime Capital共同领投,参与融资的还有Canaan、Flint Capital和S16VC。本轮融资使Cynomi的总融资达到约6000万美元,融资后估值超过1.4亿美元。这笔资金将用于在美国和欧洲的产品研究开发和扩张,以及扩展其人工智能驱动的vCISO平台。

  Cynomi由前以色列国防军8200部队中校、以色列网络安全局技术执行董事David Primor博士和牛津大学创业孵化器前负责人、连续创业者Roy Azoulay共同创立,Cynomi在为中小企业提供企业级网络安全服务方面具有独特优势。Cynomi的AI驱动平台结合了CISO级别的知识和经验,自动化vCISO任务,帮助服务提供商提高运营效率,增强客户留存率。

  Cloud Capital是一家专注于云基础设施的金融科技平台,其平台结合实时使用数据、工程计划和财务模型,可预测云支出并识别安全的无承诺节省机会。对于准备做出长期云基础设施承诺的企业,它还承保长期云合同的财务风险,并代表客户承担任何负债。该公司由经验比较丰富的SaaS领域创业者爱德华・巴罗(CEO)、斯宾塞・平格里(CTO)和扎克・利西奥(CPO)共同创立,他们在之前的工作中经历了云成本管理的复杂性,因此决定通过创办Cloud Capital解决这样一些问题。目前,Cloud Capital已经帮助北美和欧洲的数十家高增长初创公司实现了显著的云成本节省。

  Healthee是一家成立于2016年的AI驱动健康福利导航平台,其核心使命是“确保无缝访问您的健康”,通过技术方法简化员工与健康福利的互动体验。平台提供了一个综合性解决方案,包括AI驱动的Zoe虚拟健康助手,帮助用户快速获取个性化、即时的回答,涵盖网络覆盖、免赔额状态、治疗选项、共同支付和自付费用等关键信息。Zoe还支持用户在开放注册期间比较和选择最合适的计划,提供预防性护理建议,旨在提升员工健康意识和福利利用率。

  Healthee平台通过优化医疗成本和提升员工满意度,为雇主和员工双赢。功能包括24/7远程医疗服务、无额外费用的护理访问、医疗价格透明度和福利导航工具,帮助用户在决策前了解成本和选项。此外,Healthee还通过API与Salesforce、Shopify等企业级系统集成,确保无缝的使用者真实的体验。目前Healthee平台的客户数量已超过15000家,服务对象包括零售、电商和媒体等领域的企业,涵盖Instacart、SiriusXM和Celonis等知名公司。

  Deep Infra由Nikola Borisov、Yessenzhar Kanapin和Georgios Papoutsis于2022年创立,致力于通过技术创新和基础设施优化,助力企业在AI领域取得成功,为开发者和公司可以提供高效、经济实惠的AI模型部署平台,通过云基础设施服务支持客户轻松部署和扩展AI应用,兼容开源及专有模型。其平台针对AI工作负载优化,采用按使用付费的定价模式,用户只需为实际消耗的资源付费,大幅度降低成本和复杂性。服务覆盖文本生成、语音识别、图像分类等多种场景,通过简单API提供访问,同时提供托管LLM服务,用户可在公司硬件上运行自定义模型,按GPU使用时间计费,价格极具竞争力。

  AI驱动的客户研究初创公司Listen Labs近日完成了最新的A轮融资,融资金额达到2700万美元。此次融资由知名风投Sequoia Capital领投,Conviction和Pear VC等机构跟投。这笔资金将用于扩大公司运营规模、拓展经营事物的规模并逐步提升AI研发技术实力,以巩固其在客户研究领域的领先地位。

  Listen Labs专注于利用人工智能技术革新客户研究方式,通过AI进行语音客户访谈并将结果自动分析为可操作的报告。企业用户提出业务问题后,Listen Labs的平台能自动设计访谈流程、招募参与者并深度分析回应,快速提供洞察。无论是测试产品、探索市场还是评估经营销售的策略,该服务都能在数小时内完成传统研究需数周的任务,帮企业更高效地理解客户的真实需求并优化决策。

  Noxtua的核心产品是名为Beck-Noxtua的法律AI平台,该平台基于自身的专有AI模型,使用C.H. Beck提供的法律数据来进行训练,能够以符合德国法律合规要求的方式来进行法律研究、分析和起草法律文件。C.H.Beck拥有德国所有法律案例和判决的数据库,这是德语国家中最大的法律数据库,包含约5500万份文件,为Noxtua的AI提供了高质量的训练数据。此外,Noxtua的AI平台运行在Northern Data Group位于德国的云基础设施上,确保了数据主权和合规性。