Llama的开源生态,包括各家垂直应用的微调,底层逻辑都是蒸馏。过去业内一种常见的安全假设是:蒸馏传递的是知识和能力,不会传递对齐属性。 换句话说,教师模型如果有某种隐藏的偏见或危险倾向,只要训练数据里没有明文写出来,学生模型就不会继承。
作者:yabohe年初火爆现在热度依旧的OpenClaw为AI Agent带来了新的想象。如果说2025是AI Agent智能体元年,想必2026将会是AI Agent真正商用化的开端,而AI ...
2026 年的前两个月,开源大模型的发布节奏已快至令人应接不暇。Arcee AI 的 Trinity Large、月之暗面的 Kimi K2.5、阿里的 Qwen3.5、智谱 AI 的 GLM-5、Cohere 的 Tiny ...
对于开源或开放API的模型,可直接提交拉取请求(可以选择同时在src目录下更新测试代码)。 如模型未开放公测,请发送测试代码到haonan.li@librai.tech,同时将测试结果更新在榜单,并提交拉取请求。我们会在验证结果的真实性之后更新榜单。 数据 我们根据每个 ...
Python 之父 35 年后复盘:只用业余 3 个月“糙快猛”起步,如今却登顶世界第一,“差即是好”今天还灵吗? Guido van Rossum 在 1989 年圣诞假期期间,着手开发 Python,仅仅用了三个月就让 Python 有了雏形。如今,这门语言不仅成为全球最受欢迎的编程语言之一 ...
自ChatGPT发布以来,大型语言模型(LLM)成为了推动人工智能发展的关键技术之一。著名机器学习和AI研究员、畅销书《Python 机器学习》的作者Sebastian Raschka近日发布了新书《Build a Large Language Model (From Scratch)》,为广大读者揭示了从零开始构建大型语言模型的全过程 ...
《Python语言程序设计》课程是面向本科生的零基础程序设计类课程。课程任务是通过对程序设计基本方法、Python语言语法、Python语言多领域应用等知识的学习,使学生能够掌握一门帮助各专业后续教学且具有广泛应用价值的编程语言。通过让学生理解编程语言及 ...
复现了之前的《【中文分词系列】 8. 更好的新词发现算法》中的新词发现算法。 在经过充分训练的情况下,用bakeoff2005的pku语料进行测试,能得到0.765的F1,优于ICLR 2019的《Unsupervised Word Discovery with Segmental Neural Language Models》的0.731 (注:这里是为了给效果提供 ...