使用 Claude API 提取数据集和尝试制作类 Claude 模型
试图蒸馏出一个 8B 的 Claude 3 ??
→
用聚类和相似度去重数据
Claude 和本人制作的数据集清洗脚本!
→