- 1、本文档共60页,其中可免费阅读21页,需付费169金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ChatGLM模型技术实战-预训练大模型技术实战-以ChatGLM-6B 为例
0
预训练大模型技术实战
以 ChatGLM-6B 为例
1
ChatGLM-6B: 单卡版本开源的对话模型
? 充分的中英双语预训练 : ChatGLM2-6B 在 1:1 比例的 中英语料上训练了 1.4T 的 token 量,兼具双语能力 , 相比于ChatGLM-6B初代模型,性能大幅提升。
? 较低的部署门槛 : FP16 半精度下,ChatGLM-6B 需要 至少 13GB 的显存进行推理,结合模型量化技术,这一 需求可以进一步降低到 10GB( INT8 ) 和 6GB( INT4 ), 使得 ChatGLM-6B 可以部署在消费级显卡上。
? 更长的序列长度 :
您可能关注的文档
- 2022企业人效管理白皮书:聚焦人效,重塑组织.docx
- 2023年半年度信用风险回顾:债券违约、商票逾期和非标违约半年度情况.docx
- ADC六大经典定点偶联技术综述 2023.docx
- AGI投资的框架逻辑-20230602.docx
- CMF中国宏观经济月度数据分析报告(第66期)稳固企稳条件的中国宏观经济.docx
- CMF中国宏观经济专题报告(第72期)中国贸易形势分析与趋势展望.docx
- CTR媒介智讯:2023年1-7月户外广告数据概览.docx
- Dealroom:2023年Q2全球风险投资报告.docx
- GlobalData:2023年全球实时支付报告.docx
- GTI 5G无线网络智能化技术需求白皮书 GTI 5G Radio Network Intelligence Technical Requirements White Paper.docx
- 2023年贵州毕节市纳雍县融媒体中心下属公司招聘35人高频考点历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年安徽蚌埠日报社招融媒体专业人才10人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年广东省广州市黄埔区文冲街环卫站招聘1人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年甘肃省定西市安定区事业单位急需紧缺人才引进9人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年国家粮食和物资储备局科学研究院招聘人员高频笔试、历年难易点考题(共500题含答案解析)模拟试卷.docx
- 2023浙江台州市民用航空管理局招聘1人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年中国地质调查局发展研究中心招聘在职人员5人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 2023年河北张家口涿鹿县事业单位招聘71人笔试历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
- 防溺水手抄报内容《文字(十四篇)》.doc
- 2023年云南西双版纳景洪市党政储备人才专项招引13人高频考点历年难、易点深度预测(共500题含答案解析)模拟试卷.docx
1亿VIP精品文档
相关文档
最近下载
- 中远海运集装箱运输有限公司COSCOSHIPPING.PDF
- 《HG30017-2013-生产区域设备检修作业安全》.pdf
- 藻酸盐敷料用于Miles术后会阴部感染性创面愈合的观察临床医学(临床医学资料).doc VIP
- 2023年湖北工业大学软件工程专业《数据结构与算法》科目期末试卷B(有答案).docx VIP
- 北京市中考英语CD篇阅读高频词汇梳理.docx
- 广东省广雅中学2023-2024学年高一上学期期中考试数学试卷.pdf
- 风湿性疾病病人的护理试题及答案.docx
- 江苏开放大学数据采集与预处理第四次形考作业答案.pdf
- 小王子绘本(适合小学生)The Little Prince.pdf
- 江苏省2023年职业学校职教高考模拟试题.pdf
文档评论(0)