国外给数据集,国内吹牛逼:锐评女娲马斯克乔布斯Skill
国外给数据集,国内吹牛逼:锐评女娲马斯克乔布斯Skill 说句得罪人的话:中国AI圈有些项目,正在重新定义“开源”二字——把README写得像史诗,却连一个原始数据都不敢往外放。 这不是技术差距,是诚意的差距。 一、国外的“开源”是卸了妆见人,咱们的“开源”是化了浓妆念经 国外的AI开源项目,玩的是“交货”。什么叫交货? 你说你开源了个模型,好,数据给我。训练数据的每一行json、每一个csv,全都扔出来。EleutherAI发The Pile,800个G的原始文 本,下载脚本都给你写好——就怕你复现不了。LAION发图文对数据集,不光给数据,连怎么筛掉NSFW内容的脚本都公开。道理很
ORIGINAL SOURCE →via Dev.to
ADVERTISEMENT
⚡ STAY AHEAD
Events like this, convergence-verified across 689 sources, land in your inbox every Sunday. Free.
GET THE SUNDAY BRIEFING →RELATED · tech
- [TECH] Pomodoro Timer Apps Compared: Pick the Best One
- [TECH] Benchmark: 1Password 8 vs. Bitwarden 2026 for Credential Autofill Speed
- [TECH] Can my mobile have Spyware
- [TECH] Software's Industrialization Moment
- [TECH] Hormuz De-Escalation Reprices Energy and Compute Together
- [TECH] ⚖️ Software Crimes Won’t Put You in Jail. They’ll Just Kill Your Career.