مشک می گوید که Grok به عنوان یک ویژگی انحصاری در X، سابقا توییتر، و همچنین به عنوان یک برنامه مستقل در دسترس خواهد بود. xAI ادعا میکند که گروک در آزمونهایی مانند GSM8k که شامل مسائل ریاضی دوره راهنمایی، سؤالات چند گزینهای چند رشتهای (MMLU) و وظایف کدنویسی محور پایتون در HumanEval است، بهتر از Llama 2 و GPT 3.5 OpenAI عمل کرد.
با این حال، Grok-1 هنوز هم در پس بازیکنان باتجربه ای مانند GPT-4 OpenAI است که آخرین نسخه ChatGPT، PalM 2 Google و مدل های Claude 2 آنتروپیک را تقویت می کند. بزرگترین تفاوت در اندازه مجموعه دادههای آموزشی و مدت زمان صرف شده برای پالایش پروژه، هم از نوع ماشینی و هم به کمک انسان است.
اوه این جالب میشه🤣🤣
— ایلان ماسک (@elonmusk) 5 نوامبر 2023
xAI در حال کار برای حل این مشکل با استخدام متخصصان انسانی از حوزه های مختلف برای بهبود آن است. گرچه Grok یک جنبه کلیدی به نفع خود دارد: ربات چت به اینترنت متصل است و داده ها را در زمان واقعی از X می گیرد. در مقابل، OpenAI ماه ها منتظر ماند تا ChatGPT را از طریق افزونه های وب به اینترنت متصل کند. اما یک بار دیگر، این یک تلاش مخاطره آمیز است، زیرا اطلاعات نادرست که اغلب در فضای مجازی منتشر می شود، می تواند به خوبی پاسخ Grok را دیکته کند تا زمانی که پرچم گذاری و اصلاح شود. xAI اطمینان می دهد: “ما در جهت ایجاد تدابیر مطمئن در برابر اشکال فاجعه بار استفاده مخرب کار خواهیم کرد.” در حال حاضر، Grok فقط از تعاملات مبتنی بر متن پشتیبانی میکند، اما این شرکت میگوید برنامههایی برای اضافه کردن قابلیتهای چند وجهی در آینده دارد تا ربات چت هوش مصنوعی بتواند ورودیهای تصویر و صدا را نیز پردازش کند.