3657
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
انتروپیک قابلیت جدیدی به نام «بازبینی امنیتی خودکار» رو به ابزار Claude Code اضافه کرده. این ویژگی با استفاده از یک دستور جدید به نام /security-review و همچنین یک اکشن GitHub، به توسعهدهندهها کمک میکنه تا مشکلات امنیتی کد رو پیدا و رفع کنن. ایده اینه که امنیت کد از همون مراحل اولیه توسعه بررسی بشه تا آسیبپذیریها قبل از رسیدن به محیط عملیاتی شناسایی و برطرف بشن.
با دستور /security-review میشه از داخل ترمینال، بدون نیاز به کامیت کردن کد، یک بررسی امنیتی انجام داد. این بررسی به دنبال الگوهای رایج آسیبپذیری مثل تزریق SQL، XSS، مشکلات احراز هویت و مجوزدهی، مدیریت ناامن داده و باگهای Dependency ها میگرده. بعد از شناسایی مشکلات، Claude Code میتونه خودش پیشنهاد رفع یا حتی اصلاح مستقیم اونها رو ارائه بده.
اکشن جدید GitHub این فرایند رو خودکارتر میکنه. به محض باز شدن یک Pull Request، کد تغییر یافته رو بررسی میکنه، طبق قوانین قابل تنظیم، موارد مشکوک رو فیلتر یا علامتگذاری میکنه و نتایج رو بهصورت کامنت داخل PR میذاره. این باعث میشه تیمها یک فرایند امنیتی ثابت و متمرکز داشته باشن و هیچ کدی بدون بررسی امنیتی به مرحله انتشار نرسه.
انتروپیک میگه خودش هم از این قابلیتها برای بررسی امنیتی کدهای داخلی، حتی Claude Code، استفاده میکنه. به گفته اونها، همین ابزار تونسته آسیبپذیریهایی مثل امکان اجرای کد از راه دور از طریق DNS rebinding و همچنین ضعف در برابر حملات SSRF رو قبل از انتشار پیدا و رفع کنه.
هر دو قابلیت الان برای همه کاربران Claude Code فعال هستن. برای استفاده از دستور /security-review کافیه آخرین نسخه رو نصب و دستور رو در پوشه پروژه اجرا کنید. برای اکشن GitHub هم راهنمای نصب و پیکربندی در مخزن رسمی انتروپیک موجوده.
@aipulse24
جمنای قابلیت جدیدی به نام Guided Learning رو معرفی کرده که برای کمک به یادگیری عمیقتر طراحی شده و به جای دادن یک جواب کوتاه، مسائل رو مرحلهبهمرحله توضیح میده و با پرسشهای باز، کاربر رو وارد فرایند یادگیری میکنه.
Guided Learning میتونه با استفاده از متن، تصویر، ویدئو، نمودار و کوییز تعاملی، یادگیری رو متنوعتر کنه. این قابلیت بر پایه مدلهای ویژه آموزش گوگل به نام LearnLM ساخته شده که با همکاری معلمها و متخصصان آموزشی توسعه پیدا کرده.
به گفته گوگل، این ابزار میتونه برای آمادگی امتحان، نوشتن تحقیق یا حتی یادگیری مهارتهای شخصی استفاده بشه و معلمها هم میتونن لینک مستقیمش رو در کلاسهای آنلاین به اشتراک بذارن. گوگل گفته هدف اینه که با Guided Learning، مسیر یادگیری برای کاربران در هر سطحی سادهتر و مؤثرتر بشه.
@aipulse24
شرکت OpenAI نسل جدید مدل هوش مصنوعی خودش با نام GPT-5 رو معرفی کرده؛ مدلی که قراره قلب تپنده نسخههای آینده ChatGPT باشه. این مدل تازه، نه فقط یک ارتقاء فنی، بلکه یک حرکت مهم در مسیر ساخت هوش مصنوعیهای عاملمحور محسوب میشه؛ یعنی هوشهایی که مثل یک دستیار واقعی میتونن کارهای پیچیده انجام بدن، نه فقط چت کنن.
GPT-5 اولین مدلیه که OpenAI اون رو «یکپارچه» میدونه؛ چون ترکیبیه از توان استدلالی سری o و سرعت پاسخگویی سری GPT. بهکمک این مدل، حالا ChatGPT میتونه وظایفی مثل ساخت اپلیکیشن، بررسی تقویم، یا تولید گزارشهای پژوهشی رو هم برعهده بگیره. از طرفی، کار کردن باهاش سادهتر شده چون GPT-5 خودش تصمیم میگیره چقدر فکر کنه و چطور بهترین پاسخ رو بده.
سم آلتمن، مدیرعامل OpenAI، در جلسه خبری گفته GPT-5 «بهترین مدل دنیاست» و اضافه کرده که این مدل، گام بزرگی بهسوی رسیدن به هوش عمومی مصنوعی (AGI) محسوب میشه؛ یعنی مدلی که بتونه از انسان در بیشتر کارها پیشی بگیره. از امروز همه کاربران رایگان ChatGPT میتونن به GPT-5 دسترسی داشته باشن. این تصمیم، بخشی از هدف OpenAI برای توزیع برابرتر هوش مصنوعیه.
طبق آمار رسمی، ChatGPT حالا بیش از ۷۰۰ میلیون کاربر هفتگی داره و انتظار میره GPT-5 با تواناییهاش، نه فقط برای کاربران عادی، بلکه برای شرکتهای فناوری، بازارهای مالی و سیاستگذاران هم اهمیت پیدا کنه. چون هم بهعنوان نشانهای از پیشرفت AI شناخته میشه و هم میتونه استانداردهای جدیدی برای رقبا تعیین کنه.
از نظر فنی، GPT-5 تونسته عملکرد خیلی خوبی در حوزه کدنویسی داشته باشه. توی آزمون SWE-bench Verified، که مجموعهای از تسکهای واقعی برنامهنویسیه، این مدل با امتیاز ۷۴.۹٪ بالاتر از Claude Opus 4.1 (با ۷۴.۵٪) و Gemini 2.5 Pro (با ۵۹.۶٪) قرار گرفته. توی حوزه علوم هم عملکرد خوبی داشته؛ مثلاً در آزمون GPQA Diamond مربوط به سوالات سطح دکتری، امتیاز ۸۹.۴٪ کسب کرده.
از نظر ایمنی و دقت هم GPT-5 پیشرفت قابل توجهی داشته. نرخ "هذیانگویی" مدل، یعنی زمانی که اطلاعات نادرست ارائه میده، به ۴.۸٪ رسیده؛ عددی که در مدلهای قبلی مثل GPT-4o حدود ۲۰٪ بود. این مدل همچنین در تشخیص درخواستهای خطرناک نسبت به درخواستهای عادی عملکرد بهتری داره و کمتر دچار قضاوت اشتباه میشه.
برای کاربران ChatGPT هم قابلیتهای جدیدی درنظر گرفته شده. حالا میتونید از بین چهار شخصیت جدید (مثل ربات، شنونده، یا شخصیت بدبین و Nerd) یکی رو انتخاب کنید تا مدل متناسب با اون شخصیت باهاتون حرف بزنه. همچنین نسخه Pro با پرداخت ۲۰۰ دلار در ماه امکانات بیشتری مثل دسترسی به GPT-5 Pro رو فراهم میکنه.
در نهایت، GPT-5 با سه نسخه مختلف (Nano، Mini و Base) به API اضافه شده و قیمت پایه اون برای توسعهدهندهها ۱.۲۵ دلار به ازای هر میلیون توکن ورودی اعلام شده. با اینکه GPT-5 در برخی حوزهها مثل تعامل با وبسایتها هنوز به سطح رقبا نرسیده، اما در مجموع میتونه نقطه عطفی در مسیر توسعه هوش مصنوعی باشه. حالا باید دید در دنیای واقعی، عملکردش چقدر با وعدهها همخوانی داره.
@aipulse24
گوگل دیپمایند نسخه جدید مدل هوش مصنوعی «جهانساز» خودش با نام Genie 3 رو معرفی کرده؛ مدلی که میتونه محیطهای سهبعدی رو بهصورت زنده و در لحظه تولید کنه و کاربرها یا عاملهای هوش مصنوعی بتونن باهاش تعامل داشته باشن. دیپمایند میگه این نسخه نسبت به قبل مدت زمان بیشتری امکان گشتوگذار در محیطها رو فراهم میکنه و حتی مکان اشیا رو در حافظه نگه میداره تا وقتی کاربر دوباره به اون نقطه برگرده، جزئیات تغییری نکرده باشن.
مدلهای «جهانساز» (World Models) نوعی سیستم هوش مصنوعی هستن که میتونن برای اهدافی مثل آموزش، سرگرمی یا حتی آموزش رباتها، محیطهای مجازی بسازن. کاربر با دادن یک پرامپت میتونه محیطی شبیه یک بازی ویدئویی ایجاد کنه، با این تفاوت که این دنیا بهجای طراحی دستی با ابزارهای سهبعدی، بهطور کامل با هوش مصنوعی ساخته میشه. گوگل در ماه دسامبر نسخه قبلی یعنی Genie 2 رو معرفی کرده بود که میتونست از روی یک تصویر، دنیایی تعاملی بسازه و حالا تیم ویژه «مدلسازی جهان» رو زیر نظر یکی از مدیران سابق پروژه Sora اوپنایآی توسعه میده.
با این حال، نسخههای قبلی محدودیتهای زیادی داشتن؛ مثلا محیطهای Genie 2 فقط تا حدود یک دقیقه قابل بازی بودن و در بسیاری مواقع جزئیات محیط بهطور غیرمنتظره تغییر میکردن. اما Genie 3 این محدودیت رو بهبود داده و حالا میشه با یک پرامپت، دنیایی ساخت که چند دقیقه تعامل مداوم رو پشتیبانی کنه. همچنین این مدل میتونه برای حدود یک دقیقه، جزئیات محیط رو در حافظه نگه داره؛ یعنی اگر از یک دیوار با نوشته خاص دور بشید و دوباره برگردید، نوشته همونطور باقی میمونه. کیفیت محیطها هم ۷۲۰p و نرخ فریم ۲۴fps خواهد بود.
یکی از قابلیتهای جدید Genie 3، امکان ایجاد رویدادهای جهانمحور با پرامپت هست. مثلا کاربر میتونه تنها با نوشتن یک دستور، شرایط آبوهوایی رو تغییر بده یا شخصیتهای جدید به محیط اضافه کنه. این ویژگی میتونه تجربه تعامل رو برای آموزش یا سرگرمی بسیار متنوعتر کنه.
با این وجود، گوگل فعلا این مدل رو بهصورت پیشنمایش تحقیقاتی محدود ارائه میکنه و فقط گروه کوچکی از پژوهشگرها و خالقان محتوا بهش دسترسی خواهند داشت تا ریسکها و راهکارهای ایمنسازی بهتر بررسی بشه. محدودیتهایی مثل نوع تعامل کاربر با محیطها و دشواری تولید متن خوانا در داخل دنیاهای ساختهشده همچنان وجود داره. گوگل گفته در آینده احتمالا این مدل رو برای آزمایشکنندههای بیشتری در دسترس قرار خواهد داد.
@aipulse24
گوگل در تازهترین بهروزرسانی اپلیکیشن Gemini، قابلیت جدیدی به نام Deep Think رو برای کاربران پلن «Google AI Ultra» فعال کرده؛ مدلی پیشرفته که توانایی حل مسائل پیچیده علمی و ریاضی رو داره.
این نسخه از مدل Gemini 2.5، با استفاده از روش «تفکر موازی» میتونه همزمان چند ایده مختلف رو بررسی و اصلاح کنه و در نهایت به راهحل بهینه برسه. جالبه بدونید نسخه کامل این مدل در رقابتهای المپیاد جهانی ریاضی (IMO) موفق به کسب مدال طلا شده و حالا نسخه سریعتر و کاربردیترش در اختیار عموم کاربران حرفهای قرار گرفته.
بر اساس ارزیابیهای داخلی گوگل، Deep Think توی حل مسائل کدنویسی پیچیده، کشف فرضیات ریاضی، و توسعه مرحلهای طراحی و محصول عملکرد چشمگیری داشته و در بنچمارکهایی مثل LiveCodeBench V6 و Humanity’s Last Exam نتایج خوبی کسب کرده.
این قابلیت فعلاً با محدودیت تعداد درخواست روزانه در دسترس کاربران Ultra هست و بهزودی از طریق API برای توسعهدهندهها هم ارائه میشه. گوگل میگه این تنها شروع مسیریه که قراره مرزهای تفکر مصنوعی رو جابهجا کنه.
@aipulse24
شرکت انتروپیک اعلام کرده که بعضی از کاربران Claude Code بهطور ۲۴ ساعته از این ابزار استفاده میکنن و حجم بالایی از منابع سرور رو مصرف میکنن. مثلاً یه کاربر با پلن ۲۰۰ دلاری، دهها هزار دلار مصرف داشته. انتروپیک گفته این استفادهها هرچند جالبه، اما هزینهی سنگینی داره و نمیتونن برای همه ادامهاش بدن.
از اون طرف، یه عدهی دیگه قوانین رو زیر پا گذاشتن و دارن حسابها رو به اشتراک میذارن یا میفروشن. این کار باعث شده کیفیت خدمات برای بقیهی کاربرا بیاد پایین و انتروپیک داره جلوی این موارد رو میگیره.
بنابراین از تاریخ ۲۸ اوت، محدودیتهای هفتگی جدیدی اعمال میشن تا از این سوءاستفادهها جلوگیری شه و در عین حال، کمترین تأثیر ممکن رو روی بقیهی کاربرا داشته باشه. کاربرای پلن Max هم اگه بخوان، میتونن مصرف اضافه رو با نرخ API بخرن.
@aipulse24
دیپ مایند بالاخره به صورت رسمی کسب مدال طلای المپیاد ریاضی رو اعلام کرده.
به دنبال اون دمیس هاسابیس هم در توییتر توضیحاتی در این مورد داده، اون گفته ما روز جمعه اعلام نکردیم چون به درخواست اولیهٔ هیئت برگزاری المپیاد جهانی ریاضی (IMO) احترام گذاشتیم؛ درخواستی که گفته بود همهٔ آزمایشگاههای هوش مصنوعی نتایجشون رو فقط بعد از این منتشر کنن که نتایج رسمی توسط کارشناسان مستقل تأیید شده باشه و شرکت کنندهها تحسینی که شایستهاش بودن رو بهدرستی دریافت کرده باشن.
الان بهمون اجازه داده شده که نتایجمون رو منتشر کنیم و خوشحالیم که یکی از اولین گروه هایی بودیم که نتایج مدلهامون بهصورت رسمی توسط کارشناسان IMO ارزیابی و تأیید شده و موفق به دریافت اولین مدال طلای رسمی برای یک سیستم هوش مصنوعی شدیم.
@aipulse24
حالا توی این بحبوحه یه اتفاق جالب هم افتاده، ظاهرا گوگل حتی یک روز قبل از OpenAI مدال طلا رو گرفته ولی اعلام نکردن!
تا این لحظه هم هیچ مطلبی درموردش روی وبسایت دیپمایند یا جای دیگهای قرار ندادن.
@aipulse24
شرکت OpenAI از قابلیت جدیدی به نام «ChatGPT Agent» رونمایی کرده که میتونه بعضی از وظایف پیچیده رو بهصورت خودکار و از ابتدا تا انتها انجام بده. این ایجنت طوری طراحی شده که فقط با یه درخواست ساده از طرف کاربر، خودش همهی مراحل لازم رو انجام بده؛ مثلاً اگه ازش بخوای یه ارائه برای جلسهی کاری آماده کنه، خودش میره اطلاعات مربوط رو جمع میکنه، تحلیلشون میکنه و یه فایل پاورپوینت قابل ویرایش تحویلت میده.
این ایجنت در واقع نسخهی پیشرفتهای از ابزارهای قبلی OpenAI مثل Operator و Deep Researchه، که حالا همهی قابلیتهاشون یک جا جمع شده. ایجنت میتونه توی صفحات وب بگرده، کلیک کنه، کد اجرا کنه، به ابزارهایی مثل تقویم و جیمیل وصل بشه و حتی با APIهای مختلف ارتباط بگیره. چیزی که این ویژگی رو خاص کرده، اینه که برای انجام خیلی از این کارها دیگه نیاز به مداخلهی مستقیم کاربر نیست، فقط کافیه هدفت رو مشخص کنی.
با این حال، OpenAI برای حفظ امنیت و کنترل کاربران یهسری محدودیت هم در نظر گرفته. ایجنت قبل از انجام هر اقدام مهمی اجازه میگیره، همهی کارهاش قابل پیگیری و متوقف شدنه و فعلاً اجازهی انجام کارهای حساس مالی یا چیزهایی که خطر سوءاستفاده داشته باشه رو نداره. کاربر میتونه مسیر کارهایی که ایجنت انجام داده رو ببینه و هر لحظه جلوی اون رو بگیره.
فعلاً این قابلیت فقط برای تعداد محدودی از کاربران نسخههای Pro، Plus و Team فعال شده و قراره بهزودی در دسترس کاربرهای Enterprise و Education هم قرار بگیره. اونایی که به این ابزار دسترسی پیدا کردن، میتونن از طریق گزینهی جدیدی به اسم Agent Mode ازش استفاده کنن. وظایف انجامشده هم توی یه گزارش شفاف برای کاربر نمایش داده میشه.
واکنشها نسبت به این ابزار جدید متفاوته. خیلیها گفتن که بالاخره هوش مصنوعی داره از مرحلهی پاسخگویی صرف عبور میکنه و تبدیل به یه دستیار واقعی میشه. اما بعضیها هم گفتن ایجنت هنوز تو اجرای بعضی کارها کند یا ناپایداره و ممکنه گاهی کار رو درست نفهمه. با این حال، خود OpenAI هم تأکید کرده که این نسخهی اولیهست و توسعهاش بهتدریج ادامه پیدا میکنه.
@aipulse24
پت گلسینگر، مدیرعامل سابق اینتل، بعد از پایان دوران ۴۰ سالهاش در این شرکت، حالا وارد مسیر تازهای شده: تلاش برای اینکه مدلهای هوش مصنوعی در راستای رشد و شکوفایی انسان عمل کنن. اون با همکاری یک شرکت فعال در حوزه اعتمادسازی مدل های هوش مصنوعی به نام Gloo، که حدود ده سال پیش توش سرمایهگذاری کرده بود، یک معیار جدید معرفی کرده به اسم Flourishing AI (FAI)؛ معیاری برای سنجش میزان همراستایی (alignment) مدلهای زبانی با ارزشها و مفاهیم انسانی.
این معیار بر اساس یک پژوهش جهانی به اسم Global Flourishing Study ساخته شده که توسط دانشگاههای هاروارد و بایلر هدایت میشه و تمرکزش روی اندازهگیری سطح رفاه انسانی (human well-being) در نقاط مختلف دنیاست.
شرکت Gloo از دل این مطالعه شش شاخص اصلی انتخاب کرده:
۱- «منش و فضیلت» (Character and Virtue)
۲- «روابط اجتماعی نزدیک» (Close Social Relationships)
۳- «شادکامی و رضایت از زندگی» (Happiness and Life Satisfaction)
۴-«معنا و هدف» (Meaning and Purpose)
۵- «سلامت روانی و جسمی» (Mental and Physical Health)
۶- «ثبات مالی و مادی» (Financial and Material Stability)
بعد هم خودش یک شاخص دیگه بهش اضافه کرده: «ایمان و معنویت» (Faith and Spirituality) تا ببینه مدلهای زبانی بزرگ در هرکدوم از این حوزهها چه عملکردی دارن.
گلسینگر در گفتوگویی با The New Stack گفته که همیشه ارتباط میان تکنولوژی و باورهای اعتقادی برایش جذاب بوده و حالا با راهاندازی FAI میخواد به این سوال پاسخ بده که آیا مدلهای هوش مصنوعی میتونن در خدمت رشد واقعی انسانها قرار بگیرن یا نه. این حرکت، بخشی از جریان روبهرشدیـه که میخواد مطمئن بشه هوش مصنوعی فقط قوی و سریع نیست، بلکه «همراستا با انسان» هم هست.
@aipulse24
ایلان ماسک چهارشنبه شب از مدل جدید هوش مصنوعی شرکت xAI با نام Grok 4 رونمایی کرد؛ مدلی پیشرفته که با هدف رقابت با ChatGPT و Gemini طراحی شده.
xAI همزمان اشتراک ماهانهی جدیدی با عنوان SuperGrok Heavy معرفی کرده که ۳۰۰ دلار قیمت داره و فعلاً گرونترین پلن بین همهی شرکتهای هوش مصنوعیه. Grok که حالا به طور عمیقتری با شبکهی اجتماعی X (توئیتر سابق) ادغام شده، قابلیت تحلیل تصویر و پاسخ به سوالات مختلف رو داره.
مدل جدید در دو نسخه منتشر شده: Grok 4 و نسخهی قویترش Grok 4 Heavy که عملکرد چندعامله داره. بهگفتهی ماسک، این نسخه مثل یه گروه مطالعه عمل میکنه و چند مدل بهصورت موازی روی یه مسئله کار میکنن و در نهایت بهترین پاسخ رو ارائه میدن. بنچمارکها نشون میدن که Grok 4 توی آزمون Humanity’s Last Exam امتیاز ۲۵.۴ درصد گرفته که از مدلهای رقیب مثل Gemini 2.5 Pro و o3 بهتره، و نسخه Heavy این مدل با ابزار تونسته به امتیاز ۴۴.۴ درصد برسه.
اما معرفی Grok 4 در شرایطی انجام شد که شرکت با یه بحران بزرگ روبهرو بوده. چند روز پیش، اکانت رسمی Grok توی X با انتشار پستهایی یهودستیزانه و تحسینآمیز نسبت به هیتلر جنجالی شد. این اتفاق باعث شد xAI اون بخش از دستورالعمل مدل رو که بهش اجازهی اظهارنظرهای "غیرسیاسیکارانه" میداد حذف کنه. با این حال، توی مراسم معرفی، ماسک و مدیرای شرکت دربارهی این حواشی سکوت کردن و تمرکز رو گذاشتن روی قدرت فنی مدل جدید.
xAI گفته که بهزودی Grok 4 رو از طریق API در اختیار توسعهدهندهها میذاره و در ماههای آینده قراره چند محصول دیگه مثل مدل کدنویسی (آگوست)، عامل چندحالته (سپتامبر) و مدل تولید ویدیو (اکتبر) هم معرفی بشن. هرچند عملکرد Grok روی کاغذ چشمگیره، اما اینکه آیا شرکتها حاضرن با وجود این حواشی ازش استفاده کنن یا نه، هنوز مشخص نیست.
@aipulse24
گوگل دیپمایند از مدل هوش مصنوعی جدیدی به نام AlphaGenome پرده برداشته که میتونه نحوه عملکرد و تأثیر جهشهای ژنتیکی رو با دقت بیسابقهای پیشبینی کنه. این مدل، قدم بزرگی در مسیر رمزگشایی از نحوه خوانده شدن دستورات ژنتیکی سلولهاست؛ یعنی همون دستورالعملهایی که بدن رو شکل میدن، رشد میدن یا حتی باعث بیماری میشن.
AlphaGenome برخلاف مدلهای قبلی، میتونه تا یک میلیون حرف DNA رو بهصورت همزمان پردازش کنه و هزاران ویژگی مولکولی رو برای هر توالی پیشبینی کنه. این یعنی پژوهشگران دیگه لازم نیست برای بررسی هر ویژگی ژنتیکی از یک مدل جداگانه استفاده کنن. با یه API ساده، میتونن تأثیر جهشهای ژنتیکی رو روی فرآیندهای مختلف مثل شروع یا پایان ژنها، میزان RNA تولیدشده یا محل اتصال پروتئینها بررسی کنن.
این مدل بر پایه معماری Enformer ساخته شده و نسبت به اون، دقت و کارایی بیشتری داره. یکی از ویژگیهای برجستهی AlphaGenome، توانایی پیشبینی دقیق جهشهایییه که باعث بیماریهای نادر میشن؛ مثل جهشهایی که روی فرآیند splice شدن RNA تأثیر میذارن. این نوع تحلیل تا حالا با هیچ مدل دیگهای ممکن نبوده.
در آزمایشهای مختلف، AlphaGenome تونسته در ۲۲ مورد از ۲۴ معیار پیشبینی توالی DNA، بهترین عملکرد رو در مقایسه با مدلهای موجود داشته باشه. این موفقیت، اون رو به یک ابزار عمومی قدرتمند تبدیل میکنه که میتونه در تحقیقات بنیادی، زیستفناوری و بررسی بیماریها مثل سرطان و اختلالات نادر ژنتیکی نقش بزرگی داشته باشه.
گرچه AlphaGenome هنوز محدودیتهایی هم داره، مثل پیشبینی دقیق اثر عناصر تنظیمکنندهی خیلی دور در توالی DNA؛ اما DeepMind قول داده که مدل رو بهبود بده و با جامعه علمی تعامل داشته باشه. این مدل در حال حاضر بهصورت پیشنمایش و فقط برای اهداف غیرتجاری از طریق API قابل استفادهست.
گوگل میگه این مدل میتونه نقش مهمی در توسعه درمانهای جدید، طراحی DNA مصنوعی هدفمند و درک عمیق از عملکرد ژن ها داشته باشه.
@aipulse24
کلودفلر از قابلیتی تازه به نام Pay Per Crawl رونمایی کرده که به صاحبان محتوا اجازه میده تا در ازای دسترسی خزندههای هوش مصنوعی به محتوای خودشون، پول دریافت کنن. این قابلیت که فعلاً بهصورت آزمایشی و خصوصی در دسترس قرار گرفته، یه راهحل میانبر برای مسئلهایه که مدتهاست ناشران و تولیدکنندگان محتوا باهاش درگیرن: یا باید همهچیز رو رایگان در اختیار مدلهای هوش مصنوعی بذارن، یا کامل جلوی دسترسی اونها رو ببندن.
ایدهی کلیدی اینه که دیگه لازم نباشه همهچیز صفر و یکی باشه. اگه یه خزنده بخواد محتوایی رو ایندکس کنه، میتونه درخواستش رو با هدر مخصوص و اعلام آمادگی برای پرداخت بفرسته و اگه قیمت از طرف ناشر مشخص شده باشه، با پرداخت اون مبلغ به محتوا دسترسی پیدا میکنه. اگرم پرداختی صورت نگیره، سرور یه پاسخ HTTP 402 (که قبلاً تقریباً هیچوقت استفاده نمیشد) برمیگردونه و خزنده از قیمت مطلع میشه. کلودفلر توی این فرآیند نقش واسط مالی رو هم بازی میکنه.
ناشرها اختیار کامل دارن که برای هر خزنده تصمیم بگیرن: اجازهی رایگان بدن، هزینه دریافت کنن یا دسترسی رو بهطور کامل ببندن. حتی اگه خزندهای حسابی توی کلودفلر نداشته باشه، باز هم میشه بهصورت مشروط ازش پول خواست، که این عملاً مثل بلاک کردنه اما با امکان مذاکرهی آینده. همچنین امکان تعریف قیمت ثابت برای کل سایت، یا اعمال استثنا برای بعضی خزندهها هم وجود داره.
کلودفلر میگه این فقط قدم اوله. در آینده، این مدل میتونه به زیرساختی برای «دیوار پرداختی عاملمحور» تبدیل بشه؛ جایی که مثلاً یه دستیار هوشمند بتونه برای پیدا کردن بهترین منابع درباره سرطان یا تحلیل یه قرارداد حقوقی، خودش بهصورت خودکار بودجه خرج کنه و بهترین نتایج رو بخره. این یعنی یه گام مهم به سمت اینترنتی که توش محتوا، ارزشگذاری و کنترل دست تولیدکنندههاست، نه خزندههای بینام و نشان.
@aipulse24
استارتاپ Midjourney که با مدلهای تولید تصویر مبتنی بر هوش مصنوعی شناخته میشه، بهتازگی از مدل تولید ویدئوی خودش به نام V1 رونمایی کرده. این مدل میتونه از یک تصویر ثابت (چه تصویر آپلودی، چه تصویر تولیدشده توسط مدلهای قبلی Midjourney) چهار ویدئوی پنجثانیهای تولید کنه و کاربران میتونن این ویدئوها رو تا چهار بار، هر بار بهمدت چهار ثانیه، طولانیتر کنن. در نتیجه، حداکثر طول ویدئویی که با V1 ساخته میشه میتونه به ۲۱ ثانیه برسه. این ویدئوها در حال حاضر فقط از طریق پلتفرم دیسکورد و در نسخهی وب در دسترس قرار دارن.
V1 بهگونهای طراحی شده که استفاده ازش هم ساده باشه و هم قابلیتهای فنی متنوعی در اختیار کاربران بذاره. از جمله تنظیماتی که در این مدل در نظر گرفته شده میشه به حالت «انیمیشن خودکار» اشاره کرد که تصویر ورودی رو بهصورت تصادفی و بدون دخالت کاربر به حرکت درمیاره. برای کاربران حرفهایتر، حالت «انیمیشن دستی» فراهم شده که در اون میتونن بهصورت متنی توضیح بدن که چه نوع حرکتی مدنظرشونه — مثل چرخش دوربین، حرکت کاراکتر یا تغییرات پسزمینه. همچنین گزینههایی برای میزان تحرک صحنه در نظر گرفته شده: از «low motion» برای حرکات آرام گرفته تا «high motion» برای صحنههای پویاتر.
از نظر هزینه، مدل V1 نسبت به مدلهای تصویری Midjourney پرمصرفتره. طبق اعلام شرکت، تولید یک ویدئو تا ۸ برابر بیشتر از یک تصویر از سهمیهی ماهانهی کاربران مصرف میکنه. اشتراک پایه برای استفاده از V1 از ۱۰ دلار در ماه شروع میشه، درحالیکه مشترکین پلن Pro (با قیمت ۶۰ دلار) و Mega (۱۲۰ دلار) امکان تولید نامحدود ویدئو در حالت Relax (حالت غیرسریع) رو دارن. البته Midjourney اعلام کرده که طی ماه آینده، سیاست قیمتگذاری برای مدلهای ویدئویی خودش رو بازبینی خواهد کرد.
از نظر جلوههای بصری، ویدئوهای تولیدشده توسط V1 در نگاه اول بیشتر «سورئال» و خیالگونه بهنظر میرسن تا واقعگرایانه؛ ویژگیای که پیشتر هم در مدلهای تصویری Midjourney دیده شده بود. با وجود اینکه این سبک ممکنه برای برخی از کاربران مناسب نباشه، اما در میان هنرمندان و خلاقان بازخورد مثبتی دریافت کرده. با این حال، هنوز مشخص نیست که V1 در عمل تا چه حد میتونه با مدلهایی مثل Veo 3 از گوگل یا Gen-4 از Runway رقابت کنه، مخصوصاً در زمینه کیفیت، پایداری تصویر و کنترلپذیری دقیق صحنه.
درنهایت، Midjourney با مدل V1 نشون داده که همچنان میخواد مرزهای خلاقیت بصری در دنیای هوش مصنوعی رو جابهجا کنه — حتی در شرایطی که از سوی نهادهای حقوقی و استودیوهای بزرگ فیلمسازی به چالش کشیده میشه. مسیر بعدی این شرکت، طبق وعدهها، توسعهی مدلهایی برای تولید رندرهای سهبعدی و شبیهسازیهای بلادرنگ خواهد بود؛ هدفی جاهطلبانه که میتونه آیندهی طراحی و داستانسرایی بصری رو متحول کنه.
@aipulse24
شرکت OpenAI قیمت API مدل o3 رو ۸۰٪ کاهش داده و این مدل حالا ۲ دلار برای هر یک میلیون توکن ورودی و ۸ دلار برای توکن خروجی هزینه خواهد داشت.
همچنین از مدل o3-pro هم در API رونمایی کرده که ۲۰ دلار برای هر یک میلیون توکن ورودی و ۸۰ دلار برای توکن خروجی هزینه داره ولی با این حال همچنان ۸۷٪ از مدل o1-pro ارزون تره.
@aipulse24
گوگل اعلام کرد ابزار هوش مصنوعی برنامهنویسی «Jules» بعد از دو ماه آزمایش عمومی از حالت بتا خارج شده. این ابزار با مدل Gemini 2.5 Pro کار میکنه، با گیتهاب یکپارچه میشه و میتونه روی ماشین مجازی گوگل کد رو اصلاح یا بهروزرسانی کنه، حتی وقتی کاربر حضور نداره.
با عرضه عمومی، نسخه رایگان روزانه ۱۵ تسک و سه تسک همزمان رو پشتیبانی میکنه. پلنهای پولی Google AI Pro و Ultra بهترتیب با قیمت ۱۹.۹۹ و ۱۲۴.۹۹ دلار، سقف استفاده رو پنج و بیست برابر بیشتر میکنن. سیاست حریم خصوصی هم شفافتر شده و داده مخزن خصوصی برای آموزش استفاده نمیشه.
«Jules» بهصورت Asynchronous کار میکنه و این هفته قابلیت باز کردن خودکار Pull Request و ویژگی «Environment Snapshots» رو دریافت کرده. از زمان بتا، بیش از ۲.۲۸ میلیون بازدید داشته که ۴۵ درصدش از موبایل بوده و گوگل قصد داره امکانات بیشتری برای این کاربران توسعه بده.
از طریق این لینک میتونید به این ابزار دسترسی داشته باشید.
@aipulse24
از امروز میتونید با اپ جمنای، کتابهای داستانی تصویری و شخصیسازیشده بسازید؛ با روایت صوتی و تصویرسازی اختصاصی. فقط کافیه داستانی که توی ذهنتونه رو توصیف کنید تا جمنای یه کتاب دهصفحهای با تصویر و صدای منحصربهفرد بسازه. حتی میتونید از عکسها و فایلهای شخصیتون هم استفاده کنید تا داستانها حالوهوای واقعیتری بگیرن.
سبک تصویرسازی هم کاملاً به انتخاب شماست، از پیکسلآرت و کمیک گرفته تا استاپموشن، عروسکی، یا حتی کتاب رنگآمیزی، و همه اینا در بیش از ۴۵ زبان مختلف در دسترسه. میتونید برای بچهتون یه داستان آموزنده بسازید، با شخصیت اصلیای که بچهتون دوستش داره. یا مثلاً یه داستان درباره منظومه شمسی که برای یه کودک ۵ ساله قابل فهم باشه. حتی نقاشی بچهتون رو آپلود کنید تا جمنای براش یه داستان تخیلی بسازه.
@aipulse24
شرکت OpenAI امروز دو مدل جدید با وزنهای باز و قابلیت استدلال پیشرفته معرفی کرده که از نظر عملکرد نزدیک به مدلهای سری o این شرکت هستن. این مدلها با نامهای gpt-oss-120b و gpt-oss-20b عرضه شدن و مدل کوچکتر این مجموعه برای اجرا روی یک GPU انویدیا یا حتی لپتاپهای معمولی با ۱۶ گیگابایت رم بهینه شدن. هر دو مدل بهصورت رایگان از طریق پلتفرم Hugging Face قابل دانلود هستن و این اولینبار از زمان انتشار GPT-2 در سال ۲۰۱۹ هست که OpenAI یک مدل زبانی باز منتشر میکنه.
OpenAI گفته این مدلها میتونن وقتی توان انجام یک وظیفه خاص رو ندارن، درخواست رو به مدلهای قدرتمندتر و غیر باز خودش در فضای ابری بفرستن. این تصمیم در حالی گرفته شده که این شرکت طی سالهای اخیر بیشتر به سمت مدلهای بسته حرکت کرده بود. فشار روزافزون از طرف آزمایشگاههای هوش مصنوعی چین مثل DeepSeek، Qwen و Moonshot AI، و همچنین درخواست اخیر دولت آمریکا برای متنباز کردن بخشی از فناوریها، از دلایل مهم این تغییر مسیر عنوان شده.
در آزمون Codeforces، مدل gpt-oss-120b امتیاز ۲۶۲۲ و مدل gpt-oss-20b امتیاز ۲۵۱۶ رو کسب کرده که بهتر از DeepSeek R1 اما ضعیفتر از مدلهای o3 و o4-mini بوده. توی آزمون Humanity’s Last Exam هم این دو مدل بهترتیب ۱۹٪ و ۱۷.۳٪ امتیاز گرفتن. با این حال، نرخ خطا یا «هذیانگویی» این مدلها بالاست و در سنجش PersonQA به ۴۹٪ و ۵۳٪ رسیده که بیش از سه برابر مدل o1 هست.
OpenAI گفته فرآیند آموزش این مدلها شبیه مدلهای اختصاصی خودش بوده و از معماری mixture-of-experts و یادگیری تقویتی با محاسبات سنگین استفاده کرده. این مدلها قابلیت فراخوانی ابزارهایی مثل جستجوی وب یا اجرای کد پایتون رو دارن، ولی صرفاً متنی هستن و نمیتونن تصویر یا صوت رو پردازش کنن. انتشارشون تحت مجوز آزاد Apache 2.0 انجام شده که به شرکتها اجازه میده بدون هزینه برای مقاصد تجاری ازشون استفاده کنن، ولی دادههای آموزشی اونها منتشر نمیشه.
OpenAI عرضه این مدلها رو چندین بار به دلیل بررسیهای ایمنی عقب انداخته بود. آزمایشها نشون داده هرچند gpt-oss کمی توانایی در حوزههای زیستی پیدا میکنه، اما به آستانه خطر بالا در این زمینهها نمیرسه. با این حال، بازار مدلهای باز بهزودی با عرضه DeepSeek R2 و مدل تازه Meta رقابتیتر میشه.
اگر حوصله اجرای لوکال این مدلهارو ندارید از طریق وبسایت gpt-oss.com میتونید این مدل هارو امتحان کنید.
@aipulse24
سم آلتمن، مدیرعامل OpenAI، اخیراً در گفتوگویی با تئو وان، کمدین و مجری پادکست This Past Weekend، به نگرانی مهمی درباره حریم خصوصی کاربران چتباتهای هوش مصنوعی اشاره کرده. او گفته که هنوز صنعت هوش مصنوعی نتونسته چارچوب مشخصی برای محافظت از حریم خصوصی گفتگوهای حساس کاربران با ابزارهایی مثل ChatGPT ایجاد کنه، بهویژه وقتی پای مسائل عاطفی، روانی یا شخصی وسطه. بهگفتهی آلتمن، چون در حال حاضر برای این نوع گفتگوها هیچ مفهومی مثل «محرمانگی دکتر و بیمار» تعریف نشده، کاربران نباید تصور کنن که صحبتهاشون با یک مدل هوش مصنوعی واقعاً امن و شخصیه.
آلتمن توضیح داده که بسیاری از کاربران، بهخصوص جوانترها، از ChatGPT بهعنوان مشاور، رواندرمانگر یا همراه احساسی استفاده میکنن و دربارهی خصوصیترین جنبههای زندگیشون باهاش حرف میزنن، اما برخلاف گفتگو با پزشک، روانشناس یا وکیل، فعلاً هیچ چارچوب قانونی مشخصی برای محافظت از این حرفها وجود نداره. این موضوع میتونه در صورت پیگرد قانونی، به ضرر کاربران تموم بشه، چون OpenAI ممکنه مجبور بشه این گفتگوها رو تحویل مراجع قضایی بده که به گفتهی آلتمن، این وضعیت میتونه جلوی پذیرش گستردهتر ابزارهای هوش مصنوعی رو بگیره.
او در ادامه گفته که باید سطح حفاظت از گفتگوهای کاربران با AI بهاندازهی گفتوگو با یک درمانگر بالا بره و تأکید کرده که چنین دغدغهای تا همین یک سال پیش اصلاً مطرح نبود.
در این مصاحبه، وقتی آلتمن از تئو وان پرسید چرا زیاد از ChatGPT استفاده نمیکنه، وان گفت که به خاطر نگرانی از حریم خصوصی فعلاً علاقهای نداره. آلتمن هم با این دیدگاه موافقت کرد و گفت منطقیه که قبل از استفادهی جدی، آدم منتظر شفافسازی قانونی بمونه.
@aipulse24
شرکت Runway ازAct-Two رونمایی کرده که نسخه پیشرفتهتری از فناوری قبلی این شرکت یعنی Act-One به شمار میره. این ابزار به کاربر اجازه میده با ترکیب یک ویدیوی اجرا (شامل حرکت، حالت چهره و گفتار) با تصویر یا ویدیویی از یک شخصیت، خروجیهایی واقعگرایانه و متحرک تولید کنه. Act-Two برای تصویرهای شخصیت، بهطور خودکار حرکات محیطی مثل لرزش دوربین رو اضافه میکنه و امکان کنترل حرکات بدن و دستها از طریق ویدیوی اجرا رو هم فراهم کرده.
این ابزار از طریق نسخه وب در دسترسه و خروجیها رو با نسبتهای مختلف تصویری و نرخ فریم ۲۴ فریم بر ثانیه تولید میکنه. هزینه استفاده از Act-Two برابر با ۵ کردیت به ازای هر ثانیه و با حداقل زمان ۳ ثانیه (۱۵ کردیت) تعیین شده. کاربران میتونن تنظیماتی مثل شدت حالتهای چهره و فعال یا غیرفعال بودن کنترل حرکات بدن رو هم پیش از تولید مشخص کنن. بهگفته Runway، این ابزار در کنترل دقیقتر ژستها، پشتیبانی از شخصیتهای غیرانسانی و ترکیب سبکهای متنوع، نسبت به نسخه قبلی خودش پیشرفت قابل توجهی داشته.
@aipulse24
فعلا ۲تا تئوری داره توی تویتر راجع به این میچرخه:
۱. موسسه المپیاد ریاضی از هردو این ها خواسته بوده که اجازه بدن تا توجه ها روی موفقیت بچه های رقابت کننده باقی بمونه و تا پایان مراسم اعلام نکنن گوگل به این درخواست متعهد مونده و اعلام نکرده ولی openai گوش نداده و زودتر اعلام کرده
۲. گمانه زنی دوم اینه که گوگل خبر رو فرستاده واسه تیم مارکتینگ و تا اونا برای انتشار و نحوه انتشار تایید های نهایی رو بدن openai اعلام کرده و توجه هارو به خودش جلب کرده
شرکت OpenAI از دستیابی به یک پیشرفت چشمگیر در توانایی استدلال مدلهای زبانی خودش در حل مسائل پیچیده ریاضی خبر داده؛ موفقیتی که میتونه یکی از جدیترین گامها در مسیر رسیدن به هوش مصنوعی عمومی (AGI) تلقی بشه. مدل آزمایشی OpenAI موفق شده در رقابت رسمی المپیاد جهانی ریاضی ۲۰۲۵، پنج مسئله از شش مسئله اصلی رو حل کنه و با کسب ۳۵ امتیاز از مجموع ۴۲، به سطح مدال طلا برسه. این اولینباریه که یک مدل هوش مصنوعی به چنین سطحی در یکی از دشوارترین آزمونهای ریاضی جهان میرسه. تمام پاسخها به زبان طبیعی نوشته شدن، هیچ ابزاری استفاده نشده و داوری هم بهصورت ناشناس توسط مدالآوران سابق IMO انجام شده.
نکته مهم اینجاست که برخلاف مدلهایی مثل AlphaGeometry که بهطور خاص برای ریاضی طراحی شدن، مدل OpenAI یه مدل عمومی برای استدلال و زبان محسوب میشه و از هیچ روش مهندسیشدهای برای حل این مسائل استفاده نکرده. به گفته الکساندر وی، سرپرست تیم تحقیقاتی این پروژه، این دستاورد نتیجه بهکارگیری تکنیکهای جدید در یادگیری تقویتی عمومی و افزایش توان محاسباتی در زمان اجراست. نوآم براون، یکی دیگه از پژوهشگرهای OpenAI، هم تأیید کرده که این مدل بر پایه روشهایی آزمایشی ساخته شده و هنوز جای زیادی برای ارتقاء داره.
جری توورک، پژوهشگر دیگه OpenAI، گفته که این مدل هیچ آموزش اختصاصی برای IMO ندیده و تنها روی مدل پایه عمومی شرکت آموزش بیشتری دیده. او این موفقیت رو یه «پیشرفت واقعی تحقیقاتی» توصیف کرده که توسط تیم وی انجام شده و احتمال داده که نسخهای از این مدل تا پایان سال منتشر بشه. به گفته توورک، همین سیستم یادگیری تقویتی، پشت چندتا از اعلامهای اخیر OpenAI هم بوده؛ از جمله ایجنت جدید ChatGPT و مدلی که توی یک رقابت برنامهنویسی نزدیکترین نتیجه رو به انسانها گرفته.
زمان انتشار این خبر هم قابل توجهه. چند روز قبل، پلتفرم MathArena گزارش داده بود که مدلهای زبانی معروف مثل Gemini 2.5 Pro، Grok-4، DeepSeek-R1 و حتی مدلهای o3 و o4-mini متعلق به خود OpenAI، عملکرد بسیار ضعیفی در حل مسائل IMO داشتن و حتی به آستانه مدال برنز هم نرسیدن. این مدلها در آزمونها پر از خطاهای منطقی، راهحلهای ناقص و حتی قضایای ساختگی بودن. در مقایسه با این نتایج، دستاورد OpenAI یه پاسخ مستقیم و پرقدرت به محدودیتهای فعلی مدلهای زبانیه.
OpenAI فعلاً برنامهای برای انتشار عمومی این مدل نداره و تأکید کرده که این یه پروژه تحقیقاتیه، نه یه محصول نهایی. با این حال، نوآم براون گفته که این فناوری در آینده میتونه به محصول تبدیل بشه و با توجه به سرعت پیشرفت، نسخههای بعدی حتی فراتر از این هم خواهند رفت. به گفته اون، این نتایج حتی برای کارکنان خود OpenAI هم غافلگیرکننده بوده و میتونن نقطه عطفی باشن که خیلیها انتظارش رو تا چند سال دیگه داشتن.
@aipulse24
شرکت Moonshot AI از مدل اوپن سورس جدید خودش به اسم Kimi K2 رونمایی کرده؛ یه مدل قدرتمند با ساختار Mixture-of-Experts که توی هر بار استفاده، ۳۲ میلیارد پارامتر فعال داره و در مجموع، به عدد خیرهکنندهی ۱ تریلیون پارامتر میرسه. Kimi K2 نهتنها توی تسکهایی مثل دانش عمومی، ریاضیات و برنامهنویسی عملکرد درخشانی داره، بلکه برای انجام وظایف عاملمحور (agentic tasks) هم بهینهسازی شده؛ یعنی فقط جواب نمیده، خودش میفهمه باید چی کار کنه و اجراش میکنه. Moonshot دو نسخه از این مدل رو منتشر کرده: نسخهی Base برای پژوهشگرها و توسعهدهندههایی که میخوان مدل رو به دلخواه خودشون تغییر بدن، و نسخهی Instruct که برای استفادهی آماده در تجربههای چت و اجرای وظایف طراحی شده.
یکی از ویژگیهای جالب Kimi K2 اینه که فقط به سؤالها جواب نمیده، بلکه میتونه خودش از ابزارها استفاده کنه و یه پروژه رو تا انتها ببره جلو. توی یه نمونه تحلیل داده، Kimi K2 با استفاده از ۱۶ مرحلهی کدنویسی در IPython، دادههای حقوق سالهای ۲۰۲۰ تا ۲۰۲۵ رو بررسی کرده و تأثیر «نسبت دورکاری» روی حقوق رو توی سطوح مختلف تجربهی شغلی تحلیل کرده. این مدل نهتنها تحلیل آماری انجام داده و نمودار ساخته، بلکه در نهایت یه وبسایت کامل با شبیهساز تعاملی ساخته که کاربر میتونه اطلاعات خودش رو وارد کنه و ببینه دورکاری براش خوبه یا نه.
از لحاظ فنی، Kimi K2 توی بنچمارکهای مهمی مثل LiveCodeBench، OJBench، SWE-bench و AIME، عملکرد فوقالعادهای داشته و تونسته بعضی از مدلهای بزرگ دیگه مثل GPT-4، Claude 4 و Gemini 2.5 رو پشت سر بذاره یا باهاشون رقابت کنه. این مدل بهویژه توی وظایف عاملمحور، عملکردی داره که باعث شده توی دستهی non-thinking models به یکی از بهترینها تبدیل بشه.
Kimi K2 با یه بهینهساز جدید به اسم MuonClip آموزش دیده؛ نسخهی پیشرفتهتر Muon که از تکنیکی به اسم qk-clip استفاده میکنه تا مشکل ناپایداری آموزش رو حل کنه. این مدل با بیش از ۱۵.۵ تریلیون توکن آموزش دیده و تیم Moonshot برای افزایش هوشمندی مدل، از دادهسازی وسیع عاملمحور و یادگیری تقویتی عمومی استفاده کرده. این یادگیری باعث شده مدل بتونه حتی برای کارهایی که معیار مشخصی ندارن (مثل نوشتن گزارش یا مدیریت ابزارها) هم تصمیمگیری کنه.
Kimi K2 از امروز روی وبسایت kimi.com در دسترس عموم قرار گرفته و کاربران میتونن بهصورت رایگان ازش استفاده کنن. نسخهی API هم ارائه شده که با استانداردهای OpenAI و Anthropic سازگاره و برای ساخت اپهای عاملمحور قابل استفادهست. هنوز ورودی تصویری به این مدل اضافه نشده و گاهی ممکنه توی تسکهای پیچیده خروجی ناقص بده، ولی Moonshot وعده داده این محدودیتها توی نسخههای بعدی برطرف میشن.
@aipulse24
کاربران اشتراکهای پولی جمنای در برخی کشورها حالا میتونن با آپلود یک عکس و توصیف صحنه مد نظرشون با استفاده از مدل Veo 3 اون رو به یک ویدیوی ۸ ثانیهای تبدیل کنن.
@aipulse24
گوگل دیپمایند اعلام کرده که Isomorphic Labs، بازوی کشف داروی این شرکت، به شروع آزمایشهای انسانی داروهای طراحیشده با هوش مصنوعی خیلی نزدیک شده.
کالین مرداک، رئیس این شرکت، توی مصاحبهای گفته که الان توی دفترشون در لندن، بعضیها دارن با کمک AI دارو برای سرطان طراحی میکنن و قدم بعدی، آزمایش روی انسانه.
Isomorphic Labs سال ۲۰۲۱ از دل پروژه AlphaFold بیرون اومد؛ همون مدلی که ساختار پروتئینها رو با دقت خیلی بالا پیشبینی میکرد و بعدها تونست تعاملشون با مولکولهایی مثل DNA و داروها رو هم شبیهسازی کنه.
این شرکت تو سال ۲۰۲۴ با Novartis و Eli Lilly همکاری کرد و بعد از انتشار AlphaFold 3، حدود ۶۰۰ میلیون دلار سرمایه جذب کرد. هدفشون ساخت یه موتور طراحی داروی سطحبالاست که بتونه با ترکیب AI و تخصص داروسازی، داروها رو خیلی سریعتر، دقیقتر و ارزونتر طراحی کنه.
مرداک میگه شاید یه روزی بتونیم فقط با یه کلیک، برای هر بیماری یه داروی جدید بسازیم.
@aipulse24
بریم سراغ جدیدترین کیس عجیب و غریب سیلیکون ولی آقای سوهام پارخ!
ایشون مثل اینکه تو مدرسه درس سو و شون رو نخونده واسه همین به شلخته درو کردن اعتقادی نداره. 😭
برای همین همزمان برای 6 الی 7 تا استارتاپ درحال کار کردن هست!!!
دو روز قبل سهیل دوشی مدیرعامل شرکت playground.ai توی یک توئیت درمورد این فرد صحبت کرد.
توی توئیتش گفت که این فرد ساکن هند هست و اخیرا استارتاپ های تحت حمایت Ycombinator (یک موسسه سرمایه گذاری خطرپذیر معروف) رو هدف قرار داده.
بعد از این توئیت تمام استارتاپ های دیگه ای هم که سهیل رو فالو میکردن اومدن و گفتن که این فرد رو استخدام کردن!
نکته جالب اینه که ایشون به نظر میرسه به شدت توی مصاحبه ها خوب عمل میکنه ولی عملکرد سر کارش زیاد جالب نیست یا شایدم دلیلش اینه که داره همزمان واسه 7 تا شرکت کار میکنه!!!
اینطور که گفته میشه ایشون از حقوق های مختلف این شرکت های متفاوت سالی 800 هزار دلار درامد داره!
همچنین افراد مختلف در تویئت هاشون گفتن که ایشون مدعی هست ساکن امریکاست تا بتونه این کارهارو بگیره ولی بعد مشخص میشه که ساکن امریکا هم نیست و ساکن هنده!
خلاصه اون توئیت سهیل 20 میلیون ویو گرفت و این خبر بسیار وایرال شد و درنتیجه سوهام سوژه یه عالمه میم و توئیت های دیگه شد
لیست یه سری از استارتاپ هایی که مشخص شده توی مصاحبه شون موفق بوده و تونسته استخدام بشه: (نصف سیلیکون ولی عه😃😃):
1. Playground AI
2. Dynamo AI
3. Union AI
4. Synthesia
5. Antimetal
6. Composio
7. Lindy
8. Browser Use
9. Resolve AI
10. Fleet AI
23 تای دیگه هم هست که از تایپ کردنشون خسته شدم😂😂
حالا واکنش ایشون؟
هیچی خیلی ریلکس رفته توی یه پادکست و گفته واقعیت داره، همزمان واسه خودش سخنگو استخدام کرده و مثل هر فردی در سیلیکون ولی (البته به صورت مجازی چون خودش که هند هست) در تلاشه که این شهرت رو تبدیل به بیزنس و پول کنه😭😭
خلاصه که فعلا به نظر میرسه:
ASI =
❌ Artificial Superintelligence
✅ Artificial Soham Intelligence
@aipulse24
بعد از معرفی نه چندان موفق Llama 4 که باعث استعفای تعدادی از مدیرای متا شد حالا زاکربرگ راه افتاده و داره کاری رو انجام میده که بیشتر از هرچیزی بلده!
خریدن رقبا!!!
توی این ۲ ۳ هفته زاکربرگ اونقدر دانشمند از شرکت های دیگه دزدیده که سوژه یه عالمه میم شده
مبالغی که بهشون پیشنهاد داده بسیار عجیب غریب هستن مثلا به یه تعدادشون در لحظه امضا قرار داد ۱۰۰ میلیون دلار داده!!
زاکربرگ از OpenAI به تنهایی ۸ تا دانشمند جذب کرده که همگی طبق توئیت یکی از کارمندان که بعدا پاک کرد بسیار افراد تاثیر گذار و حساسی هستن و از اینکه مدیریت برای حفظ اونها هیچ کاری نکرده شاکی هست
یکی از اونها حتی خالق ایده مدل های Reasoning هست!!
این شرایط باعث شده که OpenAi مدعی بشه که کارمندانش خسته ان و کلا هفته جاری رو برای همه کارمندان توی OpenAi تعطیل کرده!
فکرکن بخوای ۱۰۰ میلیون دلار رو با ۱ هفته تعطیلی حل کنی😭
این شرایط بسیار شبیه به چیزیه که سالها قبل جف بزوس برای الکسا ایجاد کرد. یک شرکت به اسم Nuance وجود داشت درحد OpenAi فعلی که واسه Speech بود بزوس تمام دانشمنداش رو خرید و فکرکنم لازم نباشه بگم بقیه ماجرا چی شد چون کسی نمیدونه Nuance کیه ولی همه الکسا رو میشناسن.
انتظار میره حداقل تا ۲ ۳ مدل اینده همچنان OpenAi پیشرو باشه چون تاثیر این استعدادها همچنان روی محصولاتی که منتشر نشدن وجود داره ولی از بعدش بسیار ضربه بزرگی برای OpenAi هست مگر اینکه بتونه سریع استعدادهارو جایگزین کنه که البته درحال حاضر جهان به شدت با کمبود نیروی هوش مصنوعی کار درست مواجهه
حالا باید ببینیم در اینده زاکربرگ میتونه یه اینستاگرام دیگه بپا کنه یا این سری مثل قبل شانس نمیاره
@aipulse24
همچنین مدل o3-pro حالا برای تمام کاربران پلن Pro در دسترس قرار گرفته. این مدل بهبود عملکرد قابل توجهی نسبت به o3 داره.
@aipulse24
ویدیوی جالبی که تماما با مدل Veo 3 گوگل و Suno تولید شده.
@aipulse24