شرکت چینی DeepSeek از مدل اوپن سورس جدیدش DeepSeek-R1 رونمایی کرده است که با مدل o1 از OpenAI رقابت تنگاتنگی دارد. نسخه پیشنمایش این مدل که اسمش DeepSeek-R1-Lite-Preview هست، در آزمونهای معتبر مثل AIME و MATH عملکرد خیلی خوبی داشته و حتی از o1 هم بهتر عمل کرده است.
این مدل جدید مثل o1 از روش «زنجیره فکری» استفاده میکند که باعث میشود مسائل پیچیده را قدم به قدم حل کند. این روش کمک میکند که مدل بتواند درستی محاسباتش را چک کند و از اشتباهات رایج دوری کند. کاربرها میتونن مراحل فکر کردن مدل را ببینند، ولی خب این دقت باعث میشود که جواب دادن به سوالهای پیچیده کمی زمانبر بشود.
با اینکه DeepSeek-R1 خیلی خوب کار میکند و از سیستمهای پیشرفتهای مثل GPT-4 و Claude هم توی بنچمارکها بهتر عمل کرده است، ولی هنوز یه سری مشکلات دارد. ضمنا از آنجایی که یه محصول چینی است، به موضوعات سیاسی حساس مربوط به چین هم جواب نمیدهد.
قراراست DeepSeek-R1 به صورت اوپنسورس منتشر بشود و API هم در دسترس کاربران قرار بگیرد. فعلاً میشود از طریق وبسایت DeepSeek Chat با آن کار کنند، و کاربرهای رایگان روزی ۵۰ تا پیام میتوانند بفرستند.