关于我们

起源与使命

CodeGeeX 由智谱 AI 研发并持续维护,是一款面向全球开发者的智能编程助手。项目起始于对国产大模型落地场景的深度思考——在通用大模型能力日益成熟的背景下,如何将自然语言理解与代码生成能力紧密融合,真正提升程序员的日常开发效率,成为团队最核心的出发点。CodeGeeX 的命名取自“Code”与“Geeks”的组合,寓意让代码编写回归创造本质,让每一位开发者都能借助智能工具更专注于逻辑设计与问题解决。目前,CodeGeeX 已向公众开放免费使用,并保持高频迭代,致力于覆盖从个人项目到企业级工程的多种编程场景。

核心技术

CodeGeeX 基于智谱 AI 自研的 GLM-130B 通用大模型进行专项调优,参数量达到千亿级别。模型在超过万亿 token 的代码语料上完成预训练,涵盖 Python、JavaScript、Java、C++、Go、TypeScript 等主流编程语言,同时也包含 Markdown、SQL、Shell 等脚本与结构化数据格式。在推理阶段,CodeGeeX 采用多阶段代码理解策略:首先对上下文进行语法与语义解析,再通过自注意力机制捕捉长距离依赖关系,最终生成高匹配度的代码片段或完整函数。与传统补全工具不同,CodeGeeX 具备多轮对话能力,能够根据开发者对注释或对话的描述逐步生成复杂逻辑,并在权限范围内支持项目级上下文感知,减少重复键入与手写样板代码。

产品功能

CodeGeeX 提供跨 IDE 的无缝接入体验,目前已支持 Visual Studio Code、JetBrains 全系(IntelliJ IDEA、PyCharm、WebStorm 等)以及 Vim/Neovim 等编辑器。核心功能包括:实时代码补全,在输入过程中根据当前文件和工程上下文推测后续内容;自然语言生成代码,输入中文或英文注释即可得到对应函数实现;代码解释与翻译,选中已有代码后模型会以自然语言描述其逻辑,并能完成跨语言转换(比如将 Python 代码转为 Java)。此外,CodeGeeX 还内置了智能问答与调试辅助模块,开发者可以直接在侧边栏提问,获取针对特定报错或算法思路的解释。最新版本已加入对深度学习框架(如 PyTorch、TensorFlow)常用 API 的优化支持,生成结果更贴近工程实践。

团队与文化

CodeGeeX 的研发团队由来自自然语言处理、编译器设计、云原生架构等多个方向的工程师与研究员组成,核心成员曾参与多个大型开源项目与工业级 AI 系统的构建。团队倡导“实用主义”与“开放协作”的文化——每一个功能的上线都经过开发者社区的真实反馈验证,并坚持半年以上稳定性测试后才正式发布。为持续降低使用门槛,CodeGeeX 官方文档提供了详尽的配置指南与常见用例,同时在 GitHub 和中文技术社区中开放 issue 与讨论区,鼓励用户提交自定义提示词模板与插件扩展。团队相信,编程助手的价值不在于替代人类,而在于缩短从想法到实现的路径,让更多人可以参与到软件生态的创造中来。