LLM に解かせる難問集と採点結果を向井が睨みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。
- [2311.12983] GAIA: a benchmark for General AI Assistants
- gaia-benchmark/GAIA · Datasets at Hugging Face
LLM に解かせる難問集と採点結果を向井が睨みました。
LLM に解かせる難問集と採点結果を向井が睨みました。ご意見感想などは Reddit やおたより投書箱にお寄せください。iTunes のレビューや星もよろしくね。