新たに登場したOpenAIのGPT-4は、「高度な推論能力の進化」を実現していると説明され、それがどの程度GPT-3.5から進化しているのかを、実際のテストを通じて調査しました。
テストは、家族関係の問題、伝統的ななぞなぞ、巡回セールスマン問題という三つのシンプルなもので構成されています。
結果から見ると、家族関係の問題では、双方のモデルとも完全な解答は出せませんでした。しかし、なぞなぞと巡回セールスマン問題ではGPT-4が明確で正確な解答を出しました。
一方、GPT-3.5はこれらの問題で苦しんでおり、推論能力の面でGPT-4が優れていることが明らかとなりました。ただし、注意点としてGPT-4が巡回セールスマン問題を解決したとの初期の見解は誤りでした。
GPT-4の登場により、AIの推論能力がどの程度進化したのか、興味深い結果が示されています。
出典 : https://medium.com/@kevin.menear/gpt-4-review-reasoning-skills-vs-gpt-3-5-25317f737839