科锐国际携手DeepSeek-R1大模型探索中高端招聘新路径
科锐国际近期宣布了一项重大技术进展,该公司已成功接入了DeepSeek-R1大模型,旨在深化人工智能技术在中高端招聘领域的应用,以期实现人才匹配效率的大幅提升。
作为国内首家在A股上市的人力资源服务企业,科锐国际在全球拥有超过100家分支机构,业务范围涵盖中高端人才搜索、招聘流程外包、灵活用工等全方位服务,以及HR SaaS、垂直领域招聘平台等多元化产品。据统计,科锐国际已成功推荐近2万名中高端管理及专业技术人员,灵活用工累计派遣人数超过38.3万。
科锐国际CTO刘之表示,DeepSeek-R1大模型的推出,不仅令人瞩目,更将推动Agents技术的进一步发展。他强调,DeepSeek-R1是OpenAI o1模型的平替版本,且更具经济性。DeepSeek-R1在大规模强化学习领域的原创性创新,开创了新的先河。尽管模型优势可能不会持续存在,因为社区跟进速度很快,但跨学科深度融合的团队总能创造出卓越的创新,这是最值得尊敬和学习的。
刘之透露,尽管OpenAI在去年9月已发布o1推理大模型,科锐国际已开始尝试利用o1为跨数据源的复杂RAG(检索增强生成)任务提供更高效的拆解能力,并预研更依赖推理能力的Agents。DeepSeek-R1与o1在推理能力上相似,因此并未改变科锐国际的产品方案和策略。然而,与o1不同的是,DeepSeek-R1的思维链是透明的,这在进行意图理解和任务规划时,可将产品转变为交互会话式,从而极大提升用户体验。
据刘之预测,随着科锐国际在不同场景接入更多模型,DeepSeek-R1完全有能力成为RAG和Agents的主力模型。事实上,DeepSeek系列模型自发布以来,已给OpenAI等大模型厂商带来了不小的压力。DeepSeek-V3和DeepSeek-R1的相继推出,不仅展示了其强大的语言理解与生成能力,还因可能更低的训练成本而受到关注。尽管DeepSeek-R1的具体训练成本未公开,但DeepSeek-V3的训练预算已公布为“2048个GPU、2个月、近600万美元”,外界普遍认为R1的训练成本可能更低。
春节期间,国内外从芯片制造商到云服务提供商,都迅速宣布了对DeepSeek的支持。可以预见,在不同GPU和云算力平台上,DeepSeek系列模型将展现出不同的性能表现。刘之指出,目前独立部署DeepSeek-R1满血版的成本仍然过高,因此科锐国际选择直接采用云服务厂商的API。
科锐国际早在2023年下半年就公开表示,已训练了面向技能与招聘的行业级预训练语言模型CRE(Career International Recruitment Embedding)。然而,科锐国际并未选择直接训练行业垂直大模型的路线,而是选择以行业垂直的Embedding模型和RAG技术为核心技术路线。这一决策基于科锐国际对AI技术发展趋势的准确判断:一是AI计算范式的转变,即通过大量数据和算力提升性能;二是通用大模型的集中化趋势明显,而垂直行业大模型面临诸多技术难题。
为了提升招聘效率和精准性,科锐国际一直在研发Embedding模型和提供RAG能力的MatchSystem匹配系统。刘之指出,大模型接入企业内部数据有三种方法:RAG、ICL上下文学习和微调。在拥有大量数据的情况下,RAG是不可或缺的方法,而RAG又离不开搜索系统和Embedding。科锐国际自2022年开始布局数据中台建设,逐渐构建了一个庞大的数据系统,广泛覆盖20多个行业与细分领域。这些数据使得CRE Embedding模型能够在真实场景中更好地贴合实际分布,从而提升匹配的精准度和效率。
CRE Embedding模型基于700GB公开数据和40GB行业简历与招聘需求数据进行预训练和任务微调。它能够深刻理解岗位需求和候选人简历中的复杂语义关系。由于招聘数据与连贯性文本不同,招聘数据通常采用扫视阅读方式,因此在模型架构设计时更加关注局部关系。同时,通过多粒度特征融合和Transformer变体等技术,使得CRE模型更符合招聘场景。
为了弥补Embedding模型的缺陷,MatchSystem结合了关键词检索,形成了一个混合检索系统。同时,MatchSystem还结合了RAG技术,以满足更灵活的查询需求。刘之表示,科锐国际之所以选择这一研发路径,不仅受到大环境的影响,更是因为原有的技术方案已无法满足需求。例如,在招聘场景中,人岗匹配过去依赖标签或知识图谱方法,但在中高端岗位招聘中会遇到问题。因此,科锐国际开始自研Embedding模型和MatchSystem匹配系统。
据悉,MatchSystem可准确匹配垂直类岗位的招聘需求,而非泛泛之谈。例如,在算法工程师这一细分岗位上,MatchSystem系统能够实现精准匹配。在获客方面,原先需要花费一周时间匹配候选人与企业用人需求的繁琐过程,现在通过MatchSystem系统可实时完成。