NVIDIA opisuje syntetické Q&A dáta, ktoré pomáhali pri tréningu Nemotronu
Nový článok na Hugging Face vysvetľuje task-seeded pipeline pre syntetické otázky a odpovede. NVIDIA tvrdí, že takto štruktúrované dáta zlepšili Nemotron-3 Nano najmä na GPQA, MMLU-Pro, kóde a commonsense úlohách.