علی بابا از مدل هوش مصنوعی QwQ رونمایی کرد؛ رقیب هوش مصنوعی OpenAI o1 در حل مسائل ریاضی و کدنویسی
شرکت علی بابا اخیرا هوش مصنوعی QwQ را معرفی کرده است. به ادعای توسعه دهنده هوش Qwen with Questions در حل مسائل ریاضی و کدنویسی می توان با هوش مصنوعی o1 رقابت کند.
آنطور که در اطلاعیه qwenlm آمده مدل QwQ که 32.5 میلیارد پارامتر دارد از قابلیت استدلال پیچیده بهره می برد و می تواند به حداکثر 32 هزار توکن پاسخ دهد. این ویژگی به آن اجازه می دهد که در مواردی که نیاز به استدلال منطقی یا برنامه ریزی دقیق وجود دارد عملکرد بهتری ارائه دهد. از جمله این موارد می توان به حل مسائل ریاضی و کدنویسی اشاره کرد.
بنچمارک های هوش مصنوعی QwQ علی بابا
در بنچمارک های مختلفی که توانایی مدل ها در حل مسائل ریاضی و استدلال علمی را ارزیابی می کنند هوش مصنوعی Qwen with Questions نشان داده که از مدل o1-preview عملکرد بهتری دارد. به عنوان مثال در بنچمارک های AIME و MATH که به ارزیابی توانایی حل مسائل ریاضی می پردازند QwQ توانست بر o1 غلبه کند. همچنین در بنچمارک GPQA که به ارزیابی استدلال علمی می پردازد QwQ عملکرد بهتری از o1-mini نشان داد.
البته در زمینه کدنویسی o1 عملکرد بهتری در بنچمارک LiveCodeBench از خود نشان داد اما QwQ همچنان از مدل های دیگر مانند GPT-4o و Claude 3.5 Sonnet بهتر عمل کرده است. این نشان می دهد که QwQ در زمینه های خاصی که نیاز به استدلال دقیق دارد بهتر عمل می کند اما در برخی از حوزه ها مدل های رقیب ممکن است قوی تر باشند.
در رابطه با فرایند آموزش این مدل علی بابا اطلاعات دقیقی منتشر نکرده است اما برخلاف o1 QwQ به صورت متن باز عرضه شده است. به این معنی که روند استدلال مدل برای کاربران قابل مشاهده است و آن ها می توانند نحوه عملکرد و تفکر مدل هنگام حل مسائل پیچیده را بررسی کنند.
علی بابا در بیانیه ای اعلام کرده که هوش مصنوعی QwQ برای بهبود خود به روش هایی نظیر “پرسش تأمل و اندیشیدن عمیق” وابسته است. این فرایند به مدل کمک کرده تا در حل مسائل پیچیده بهبودهای قابل توجهی به دست آورد. با این حال شرکت اشاره کرده که QwQ در برخی موارد ممکن است با مشکلاتی نظیر ترکیب زبان ها یا گیر کردن در حلقه های استدلال مواجه شود.
در حال حاضر نسخه آزمایشی مدل QwQ در دسترس است و می توانید از طریق Hugging Face آن را امتحان کنید. اما این مدل هنوز در مراحل اولیه قرار دارد و به نظر می رسد که نسخه نهایی و کامل تر آن در آینده ای نه چندان دور عرضه شود.
بیشتر بخوانید:
-
گزارش شاخص هوش مصنوعی ایران در سال 1403 منتشر شد
ماسک از راه اندازی استودیوی بازی سازی مبتنی بر هوش مصنوعی خبر داد