

编者按:在人工智能浪潮席卷全球的今天,技术自主与生态构建成为各国科技竞争的焦点。韩国科技巨头Naver Cloud近日重磅发布其独立AI基础模型项目的蓝图,剑指“全能模型”新时代,誓言以单一模型理解多元世界。其核心并非盲目追逐参数规模的军备竞赛,而是致力于构建一个整合基础设施、人才、数据与服务的“主权AI”生态系统。尤为引人注目的是,其模型在推理能力上展现出以小博大的强悍实力,并在多模态领域实现了关键突破。从优化本土产业到布局全球市场,Naver Cloud的野心清晰可见:打造以自主技术为核心、深入行业场景、并具全球适应性的AI未来。这不仅是技术路线的宣告,更是一场关于AI发展主权与产业变革路径的深刻思考。
“我们将开启理解世界的全能模型人工智能时代。”
Naver Cloud人工智能技术负责人Sung Nak-ho于30日在首尔三成洞Coex Auditorium举行的“独立AI基础模型项目首次发布会”上公布了项目蓝图,并如此宣告。全能模型AI意味着用一个统一的AI模型处理文本、图像、语音等多种数据格式。换言之,其设计目标不是将针对特定功能分别开发的AI模型拼接起来,而是让一个模型能够跨多种模态(AI中信息输入和输出的形式)进行理解、推理和响应。
Sung强调:“Naver Cloud在此项目中的重点,并非竞争扩大模型规模,而是构建一个‘主权AI’生态系统,通过将基础设施、人才、数据和服务整合到一个框架中,以实现发展的结构与平衡。”
Naver Cloud首先着重展示了‘HyperCLOVA X SEED’的推理竞争力。其最新模型‘HyperCLOVA X SEED 32B Think’在基于电信客服中心查询场景评估复杂任务执行能力的‘τ2-Bench Telecom’中取得了87.4%的成绩。Sung表示:“它在同规模的小型模型组中排名第一,在包含主要大型模型在内的总排名中也位居顶级。模型的竞争力在于高质量的推理能力,而非参数数量。”
同日,Naver Cloud发布了多模态领域国内首个‘Any-to-Any’全能模型‘HyperCLOVA X SEED 8B Omni’。Sung解释道:“它不同于以往添加独立OCR模型的方式,而是通过‘整体性学习’整合理解文本、图像、音频等多种模态,并能实现实时交互。这减少了图形识别过程中的语义损失,同时确保了产业现场应用时的成本效益和实用性。”
Naver Cloud还提出了将针对韩语优化的推理性能与语音识别相结合以提升用户体验的构想。作为此竞争力的基础,公司列举了其‘全栈AI价值链’。Sung指出:“基于自有的AI数据中心、GPU基础设施和云平台,我们从数据收集生成、模型开发到服务实现的整个过程都实现了垂直整合,从而提高了速度和效率。”
关于人才培养,Sung提到通过与KAIST、POSTECH、首尔大学、高丽大学、汉阳大学等五所主要大学的研究人员合作开展驻留项目,以深化多模态AI核心技术研究。他补充道:“我们通过与Twelve Labs等专业公司合作来加强数据处理能力,同时培育协作体系以激活国内初创企业生态。”
Naver Cloud宣布将加速超越通用模型、针对特定行业的‘垂直AI’扩展。Sung表示:“我们的战略是向金融、国防、制造、流通、航空航天、重工业、能源、农业等核心产业分发优化后的轻量模型,以促进AI转型并提升国家竞争力。”
Naver Cloud的主权AI战略也延伸至海外。Sung说:“基于在韩国积累的建设经验,我们正在日本、泰国和沙特阿拉伯打造反映各国文化和语言特点的本地化定制AI生态系统。”在日本,公司通过为独居老人提供的‘Naver Care Call’服务,助力解决孤独死预防等社会问题。在泰国和沙特阿拉伯,则正在开发本地语言大模型,并推进基于数字孪生的智慧城市合作。
Sung总结道:“我们的使命是率先触达受AI影响的群体,引领产业的AI转型,并守护国家的AI主权。我们将以独立基础模型为核心,把基础设施、人才、产业应用和全球扩张连接成一个生态系统,从而在日常生活中实现以人为本、包容普惠的AI。”