LLM をチャットボットに仕立てる finetuning について森田が読みました。ご意見ご感想などはおたより投書箱や Reddit にお寄せください。iTunes のレビューや星も歓迎です。
- [2203.02155] Training language models to follow instructions with human feedback
- [2212.08073] Constitutional AI: Harmlessness from AI Feedback
- It looks like GPT-4-32k is rolling out | Hacker News
- Anthropic | Introducing Claude
- Goodhart’s law – Wikipedia