Skip to content
techLOW2026-05-02 02:24 UTC

国外给数据集,国内吹牛逼:锐评女娲马斯克乔布斯Skill

国外给数据集,国内吹牛逼:锐评女娲马斯克乔布斯Skill 说句得罪人的话:中国AI圈有些项目,正在重新定义“开源”二字——把README写得像史诗,却连一个原始数据都不敢往外放。 这不是技术差距,是诚意的差距。 一、国外的“开源”是卸了妆见人,咱们的“开源”是化了浓妆念经 国外的AI开源项目,玩的是“交货”。什么叫交货? 你说你开源了个模型,好,数据给我。训练数据的每一行json、每一个csv,全都扔出来。EleutherAI发The Pile,800个G的原始文 本,下载脚本都给你写好——就怕你复现不了。LAION发图文对数据集,不光给数据,连怎么筛掉NSFW内容的脚本都公开。道理很

ADVERTISEMENT
⚡ STAY AHEAD

Events like this, convergence-verified across 689 sources, land in your inbox every Sunday. Free.

GET THE SUNDAY BRIEFING →

RELATED · tech