Telegram-канал aipulse24 - AI Pulse: Unsorted - каталог телеграмм

aipulse24 | Unsorted

Subscribe to a channel

Telegram-канал aipulse24 - AI Pulse

3657

اخبار، اموزش و معرفی ابزارهای هوش مصنوعی

Subscribe to a channel

AI Pulse

08 August 2025 19:04

انتروپیک قابلیت جدیدی به نام «بازبینی امنیتی خودکار» رو به ابزار Claude Code اضافه کرده. این ویژگی با استفاده از یک دستور جدید به نام /security-review و همچنین یک اکشن GitHub، به توسعه‌دهنده‌ها کمک می‌کنه تا مشکلات امنیتی کد رو پیدا و رفع کنن. ایده اینه که امنیت کد از همون مراحل اولیه توسعه بررسی بشه تا آسیب‌پذیری‌ها قبل از رسیدن به محیط عملیاتی شناسایی و برطرف بشن.

با دستور /security-review می‌شه از داخل ترمینال، بدون نیاز به کامیت کردن کد، یک بررسی امنیتی انجام داد. این بررسی به دنبال الگوهای رایج آسیب‌پذیری مثل تزریق SQL، XSS، مشکلات احراز هویت و مجوزدهی، مدیریت ناامن داده و باگ‌های Dependency ها می‌گرده. بعد از شناسایی مشکلات، Claude Code می‌تونه خودش پیشنهاد رفع یا حتی اصلاح مستقیم اون‌ها رو ارائه بده.

اکشن جدید GitHub این فرایند رو خودکارتر می‌کنه. به محض باز شدن یک Pull Request، کد تغییر یافته رو بررسی می‌کنه، طبق قوانین قابل تنظیم، موارد مشکوک رو فیلتر یا علامت‌گذاری می‌کنه و نتایج رو به‌صورت کامنت داخل PR می‌ذاره. این باعث می‌شه تیم‌ها یک فرایند امنیتی ثابت و متمرکز داشته باشن و هیچ کدی بدون بررسی امنیتی به مرحله انتشار نرسه.

انتروپیک می‌گه خودش هم از این قابلیت‌ها برای بررسی امنیتی کدهای داخلی، حتی Claude Code، استفاده می‌کنه. به گفته اون‌ها، همین ابزار تونسته آسیب‌پذیری‌هایی مثل امکان اجرای کد از راه دور از طریق DNS rebinding و همچنین ضعف در برابر حملات SSRF رو قبل از انتشار پیدا و رفع کنه.

هر دو قابلیت الان برای همه کاربران Claude Code فعال هستن. برای استفاده از دستور /security-review کافیه آخرین نسخه رو نصب و دستور رو در پوشه پروژه اجرا کنید. برای اکشن GitHub هم راهنمای نصب و پیکربندی در مخزن رسمی انتروپیک موجوده.

@aipulse24

Читать полностью…

AI Pulse

08 August 2025 09:31

جمنای قابلیت جدیدی به نام Guided Learning رو معرفی کرده که برای کمک به یادگیری عمیق‌تر طراحی شده و به جای دادن یک جواب کوتاه، مسائل رو مرحله‌به‌مرحله توضیح می‌ده و با پرسش‌های باز، کاربر رو وارد فرایند یادگیری می‌کنه.

‏Guided Learning می‌تونه با استفاده از متن، تصویر، ویدئو، نمودار و کوییز تعاملی، یادگیری رو متنوع‌تر کنه. این قابلیت بر پایه مدل‌های ویژه آموزش گوگل به نام LearnLM ساخته شده که با همکاری معلم‌ها و متخصصان آموزشی توسعه پیدا کرده.

به گفته گوگل، این ابزار می‌تونه برای آمادگی امتحان، نوشتن تحقیق یا حتی یادگیری مهارت‌های شخصی استفاده بشه و معلم‌ها هم می‌تونن لینک مستقیمش رو در کلاس‌های آنلاین به اشتراک بذارن. گوگل گفته هدف اینه که با Guided Learning، مسیر یادگیری برای کاربران در هر سطحی ساده‌تر و مؤثرتر بشه.

@aipulse24

Читать полностью…

AI Pulse

07 August 2025 19:50

شرکت OpenAI نسل جدید مدل هوش مصنوعی خودش با نام GPT-5 رو معرفی کرده؛ مدلی که قراره قلب تپنده نسخه‌های آینده ChatGPT باشه. این مدل تازه، نه فقط یک ارتقاء فنی، بلکه یک حرکت مهم در مسیر ساخت هوش مصنوعی‌های عامل‌محور محسوب میشه؛ یعنی هوش‌هایی که مثل یک دستیار واقعی می‌تونن کارهای پیچیده انجام بدن، نه فقط چت کنن.

‏GPT-5 اولین مدلیه که OpenAI اون رو «یکپارچه» می‌دونه؛ چون ترکیبیه از توان استدلالی سری o و سرعت پاسخگویی سری GPT. به‌کمک این مدل، حالا ChatGPT می‌تونه وظایفی مثل ساخت اپلیکیشن، بررسی تقویم، یا تولید گزارش‌های پژوهشی رو هم برعهده بگیره. از طرفی، کار کردن باهاش ساده‌تر شده چون GPT-5 خودش تصمیم می‌گیره چقدر فکر کنه و چطور بهترین پاسخ رو بده.

سم آلتمن، مدیرعامل OpenAI، در جلسه خبری گفته GPT-5 «بهترین مدل دنیاست» و اضافه کرده که این مدل، گام بزرگی به‌سوی رسیدن به هوش عمومی مصنوعی (AGI) محسوب میشه؛ یعنی مدلی که بتونه از انسان در بیشتر کارها پیشی بگیره. از امروز همه کاربران رایگان ChatGPT می‌تونن به GPT-5 دسترسی داشته باشن. این تصمیم، بخشی از هدف OpenAI برای توزیع برابرتر هوش مصنوعیه.

طبق آمار رسمی، ChatGPT حالا بیش از ۷۰۰ میلیون کاربر هفتگی داره و انتظار می‌ره GPT-5 با توانایی‌هاش، نه فقط برای کاربران عادی، بلکه برای شرکت‌های فناوری، بازارهای مالی و سیاست‌گذاران هم اهمیت پیدا کنه. چون هم به‌عنوان نشانه‌ای از پیشرفت AI شناخته می‌شه و هم می‌تونه استانداردهای جدیدی برای رقبا تعیین کنه.

از نظر فنی، GPT-5 تونسته عملکرد خیلی خوبی در حوزه کدنویسی داشته باشه. توی آزمون SWE-bench Verified، که مجموعه‌ای از تسک‌های واقعی برنامه‌نویسیه، این مدل با امتیاز ۷۴.۹٪ بالاتر از Claude Opus 4.1 (با ۷۴.۵٪) و Gemini 2.5 Pro (با ۵۹.۶٪) قرار گرفته. توی حوزه علوم هم عملکرد خوبی داشته؛ مثلاً در آزمون GPQA Diamond مربوط به سوالات سطح دکتری، امتیاز ۸۹.۴٪ کسب کرده.

از نظر ایمنی و دقت هم GPT-5 پیشرفت قابل توجهی داشته. نرخ "هذیان‌گویی" مدل، یعنی زمانی که اطلاعات نادرست ارائه می‌ده، به ۴.۸٪ رسیده؛ عددی که در مدل‌های قبلی مثل GPT-4o حدود ۲۰٪ بود. این مدل همچنین در تشخیص درخواست‌های خطرناک نسبت به درخواست‌های عادی عملکرد بهتری داره و کمتر دچار قضاوت اشتباه می‌شه.

برای کاربران ChatGPT هم قابلیت‌های جدیدی درنظر گرفته شده. حالا می‌تونید از بین چهار شخصیت جدید (مثل ربات، شنونده، یا شخصیت بدبین و Nerd) یکی رو انتخاب کنید تا مدل متناسب با اون شخصیت باهاتون حرف بزنه. همچنین نسخه Pro با پرداخت ۲۰۰ دلار در ماه امکانات بیشتری مثل دسترسی به GPT-5 Pro رو فراهم می‌کنه.

در نهایت، GPT-5 با سه نسخه مختلف (Nano، Mini و Base) به API اضافه شده و قیمت پایه اون برای توسعه‌دهنده‌ها ۱.۲۵ دلار به ازای هر میلیون توکن ورودی اعلام شده. با اینکه GPT-5 در برخی حوزه‌ها مثل تعامل با وب‌سایت‌ها هنوز به سطح رقبا نرسیده، اما در مجموع می‌تونه نقطه عطفی در مسیر توسعه هوش مصنوعی باشه. حالا باید دید در دنیای واقعی، عملکردش چقدر با وعده‌ها همخوانی داره.

@aipulse24

Читать полностью…

AI Pulse

06 August 2025 18:04

گوگل دیپ‌مایند نسخه جدید مدل هوش مصنوعی «جهان‌ساز» خودش با نام Genie 3 رو معرفی کرده؛ مدلی که می‌تونه محیط‌های سه‌بعدی رو به‌صورت زنده و در لحظه تولید کنه و کاربرها یا عامل‌های هوش مصنوعی بتونن باهاش تعامل داشته باشن. دیپ‌مایند میگه این نسخه نسبت به قبل مدت زمان بیشتری امکان گشت‌وگذار در محیط‌ها رو فراهم می‌کنه و حتی مکان اشیا رو در حافظه نگه می‌داره تا وقتی کاربر دوباره به اون نقطه برگرده، جزئیات تغییری نکرده باشن.

مدل‌های «جهان‌ساز» (World Models) نوعی سیستم هوش مصنوعی هستن که می‌تونن برای اهدافی مثل آموزش، سرگرمی یا حتی آموزش ربات‌ها، محیط‌های مجازی بسازن. کاربر با دادن یک پرامپت می‌تونه محیطی شبیه یک بازی ویدئویی ایجاد کنه، با این تفاوت که این دنیا به‌جای طراحی دستی با ابزارهای سه‌بعدی، به‌طور کامل با هوش مصنوعی ساخته میشه. گوگل در ماه دسامبر نسخه قبلی یعنی Genie 2 رو معرفی کرده بود که می‌تونست از روی یک تصویر، دنیایی تعاملی بسازه و حالا تیم ویژه «مدل‌سازی جهان» رو زیر نظر یکی از مدیران سابق پروژه Sora اوپن‌ای‌آی توسعه میده.

با این حال، نسخه‌های قبلی محدودیت‌های زیادی داشتن؛ مثلا محیط‌های Genie 2 فقط تا حدود یک دقیقه قابل بازی بودن و در بسیاری مواقع جزئیات محیط به‌طور غیرمنتظره تغییر می‌کردن. اما Genie 3 این محدودیت رو بهبود داده و حالا میشه با یک پرامپت، دنیایی ساخت که چند دقیقه تعامل مداوم رو پشتیبانی کنه. همچنین این مدل می‌تونه برای حدود یک دقیقه، جزئیات محیط رو در حافظه نگه داره؛ یعنی اگر از یک دیوار با نوشته خاص دور بشید و دوباره برگردید، نوشته همون‌طور باقی می‌مونه. کیفیت محیط‌ها هم ۷۲۰p و نرخ فریم ۲۴fps خواهد بود.

یکی از قابلیت‌های جدید Genie 3، امکان ایجاد رویدادهای جهان‌محور با پرامپت هست. مثلا کاربر می‌تونه تنها با نوشتن یک دستور، شرایط آب‌وهوایی رو تغییر بده یا شخصیت‌های جدید به محیط اضافه کنه. این ویژگی می‌تونه تجربه تعامل رو برای آموزش یا سرگرمی بسیار متنوع‌تر کنه.

با این وجود، گوگل فعلا این مدل رو به‌صورت پیش‌نمایش تحقیقاتی محدود ارائه می‌کنه و فقط گروه کوچکی از پژوهشگرها و خالقان محتوا بهش دسترسی خواهند داشت تا ریسک‌ها و راهکارهای ایمن‌سازی بهتر بررسی بشه. محدودیت‌هایی مثل نوع تعامل کاربر با محیط‌ها و دشواری تولید متن خوانا در داخل دنیاهای ساخته‌شده همچنان وجود داره. گوگل گفته در آینده احتمالا این مدل رو برای آزمایش‌کننده‌های بیشتری در دسترس قرار خواهد داد.

@aipulse24

Читать полностью…

AI Pulse

01 August 2025 20:01

گوگل در تازه‌ترین به‌روزرسانی اپلیکیشن Gemini، قابلیت جدیدی به نام Deep Think رو برای کاربران پلن «Google AI Ultra» فعال کرده؛ مدلی پیشرفته که توانایی حل مسائل پیچیده علمی و ریاضی رو داره.

این نسخه از مدل Gemini 2.5، با استفاده از روش «تفکر موازی» می‌تونه هم‌زمان چند ایده مختلف رو بررسی و اصلاح کنه و در نهایت به راه‌حل بهینه برسه. جالبه بدونید نسخه کامل این مدل در رقابت‌های المپیاد جهانی ریاضی (IMO) موفق به کسب مدال طلا شده و حالا نسخه سریع‌تر و کاربردی‌ترش در اختیار عموم کاربران حرفه‌ای قرار گرفته.

بر اساس ارزیابی‌های داخلی گوگل، Deep Think توی حل مسائل کدنویسی پیچیده، کشف فرضیات ریاضی، و توسعه مرحله‌ای طراحی و محصول عملکرد چشم‌گیری داشته و در بنچ‌مارک‌هایی مثل LiveCodeBench V6 و Humanity’s Last Exam نتایج خوبی کسب کرده.

این قابلیت فعلاً با محدودیت تعداد درخواست روزانه در دسترس کاربران Ultra هست و به‌زودی از طریق API برای توسعه‌دهنده‌ها هم ارائه می‌شه. گوگل می‌گه این تنها شروع مسیریه که قراره مرزهای تفکر مصنوعی رو جابه‌جا کنه.

@aipulse24

Читать полностью…

AI Pulse

29 July 2025 17:45

شرکت انتروپیک اعلام کرده که بعضی از کاربران Claude Code به‌طور ۲۴ ساعته از این ابزار استفاده می‌کنن و حجم بالایی از منابع سرور رو مصرف می‌کنن. مثلاً یه کاربر با پلن ۲۰۰ دلاری، ده‌ها هزار دلار مصرف داشته. انتروپیک گفته این استفاده‌ها هرچند جالبه، اما هزینه‌ی سنگینی داره و نمی‌تونن برای همه ادامه‌اش بدن.

از اون طرف، یه عده‌ی دیگه قوانین رو زیر پا گذاشتن و دارن حساب‌ها رو به اشتراک می‌ذارن یا می‌فروشن. این کار باعث شده کیفیت خدمات برای بقیه‌ی کاربرا بیاد پایین و انتروپیک داره جلوی این موارد رو می‌گیره.

بنابراین از تاریخ ۲۸ اوت، محدودیت‌های هفتگی جدیدی اعمال می‌شن تا از این سوءاستفاده‌ها جلوگیری شه و در عین حال، کمترین تأثیر ممکن رو روی بقیه‌ی کاربرا داشته باشه. کاربرای پلن Max هم اگه بخوان، می‌تونن مصرف اضافه رو با نرخ API بخرن.

@aipulse24

Читать полностью…

AI Pulse

21 July 2025 20:25

دیپ مایند بالاخره به صورت رسمی کسب مدال طلای المپیاد ریاضی رو اعلام کرده.

به دنبال اون دمیس هاسابیس هم در توییتر توضیحاتی در این مورد داده، اون گفته ما روز جمعه اعلام نکردیم چون به درخواست اولیهٔ هیئت برگزاری المپیاد جهانی ریاضی (IMO) احترام گذاشتیم؛ درخواستی که گفته بود همهٔ آزمایشگاه‌های هوش مصنوعی نتایجشون رو فقط بعد از این منتشر کنن که نتایج رسمی توسط کارشناسان مستقل تأیید شده باشه و شرکت کننده‌ها تحسینی که شایسته‌اش بودن رو به‌درستی دریافت کرده باشن.

الان بهمون اجازه داده شده که نتایجمون رو منتشر کنیم و خوشحالیم که یکی از اولین گروه هایی بودیم که نتایج مدل‌هامون به‌صورت رسمی توسط کارشناسان IMO ارزیابی و تأیید شده و موفق به دریافت اولین مدال طلای رسمی برای یک سیستم هوش مصنوعی شدیم.

@aipulse24

Читать полностью…

AI Pulse

20 July 2025 19:31

حالا توی این بحبوحه یه اتفاق جالب هم افتاده، ظاهرا گوگل حتی یک روز قبل از OpenAI مدال طلا رو گرفته ولی اعلام نکردن!
تا این لحظه هم هیچ مطلبی درموردش روی وبسایت دیپ‌مایند یا جای دیگه‌ای قرار ندادن.

@aipulse24

Читать полностью…

AI Pulse

19 July 2025 21:14

شرکت OpenAI از قابلیت جدیدی به نام «ChatGPT Agent» رونمایی کرده که می‌تونه بعضی از وظایف پیچیده رو به‌صورت خودکار و از ابتدا تا انتها انجام بده. این ایجنت طوری طراحی شده که فقط با یه درخواست ساده از طرف کاربر، خودش همه‌ی مراحل لازم رو انجام بده؛ مثلاً اگه ازش بخوای یه ارائه برای جلسه‌ی کاری آماده کنه، خودش می‌ره اطلاعات مربوط رو جمع می‌کنه، تحلیلشون می‌کنه و یه فایل پاورپوینت قابل ویرایش تحویلت می‌ده.

این ایجنت در واقع نسخه‌ی پیشرفته‌ای از ابزارهای قبلی OpenAI مثل Operator و Deep Researchه، که حالا همه‌ی قابلیت‌هاشون یک جا جمع شده. ایجنت می‌تونه توی صفحات وب بگرده، کلیک کنه، کد اجرا کنه، به ابزارهایی مثل تقویم و جیمیل وصل بشه و حتی با APIهای مختلف ارتباط بگیره. چیزی که این ویژگی رو خاص کرده، اینه که برای انجام خیلی از این کارها دیگه نیاز به مداخله‌ی مستقیم کاربر نیست، فقط کافیه هدفت رو مشخص کنی.

با این حال، OpenAI برای حفظ امنیت و کنترل کاربران یه‌سری محدودیت‌ هم در نظر گرفته. ایجنت قبل از انجام هر اقدام مهمی اجازه می‌گیره، همه‌ی کارهاش قابل پیگیری و متوقف شدنه و فعلاً اجازه‌ی انجام کارهای حساس مالی یا چیزهایی که خطر سوءاستفاده داشته باشه رو نداره. کاربر می‌تونه مسیر کارهایی که ایجنت انجام داده رو ببینه و هر لحظه جلوی اون رو بگیره.

فعلاً این قابلیت فقط برای تعداد محدودی از کاربران نسخه‌های Pro، Plus و Team فعال شده و قراره به‌زودی در دسترس کاربرهای Enterprise و Education هم قرار بگیره. اونایی که به این ابزار دسترسی پیدا کردن، می‌تونن از طریق گزینه‌ی جدیدی به اسم Agent Mode ازش استفاده کنن. وظایف انجام‌شده هم توی یه گزارش شفاف برای کاربر نمایش داده می‌شه.

واکنش‌ها نسبت به این ابزار جدید متفاوته. خیلی‌ها گفتن که بالاخره هوش مصنوعی داره از مرحله‌ی پاسخ‌گویی صرف عبور می‌کنه و تبدیل به یه دستیار واقعی می‌شه. اما بعضی‌ها هم گفتن ایجنت هنوز تو اجرای بعضی کارها کند یا ناپایداره و ممکنه گاهی کار رو درست نفهمه. با این حال، خود OpenAI هم تأکید کرده که این نسخه‌ی اولیه‌ست و توسعه‌اش به‌تدریج ادامه پیدا می‌کنه.

@aipulse24

Читать полностью…

AI Pulse

12 July 2025 17:33

پت گلسینگر، مدیرعامل سابق اینتل، بعد از پایان دوران ۴۰ ساله‌اش در این شرکت، حالا وارد مسیر تازه‌ای شده: تلاش برای این‌که مدل‌های هوش مصنوعی در راستای رشد و شکوفایی انسان عمل کنن. اون با همکاری یک شرکت فعال در حوزه اعتمادسازی مدل های هوش مصنوعی به نام Gloo، که حدود ده سال پیش توش سرمایه‌گذاری کرده بود، یک معیار جدید معرفی کرده به اسم Flourishing AI (FAI)؛ معیاری برای سنجش میزان هم‌راستایی (alignment) مدل‌های زبانی با ارزش‌ها و مفاهیم انسانی.

این معیار بر اساس یک پژوهش جهانی به اسم Global Flourishing Study ساخته شده که توسط دانشگاه‌های هاروارد و بایلر هدایت می‌شه و تمرکزش روی اندازه‌گیری سطح رفاه انسانی (human well-being) در نقاط مختلف دنیاست.

شرکت Gloo از دل این مطالعه شش شاخص اصلی انتخاب کرده:
۱- «منش و فضیلت» (Character and Virtue)
۲- «روابط اجتماعی نزدیک» (Close Social Relationships)
۳- «شادکامی و رضایت از زندگی» (Happiness and Life Satisfaction)
۴-«معنا و هدف» (Meaning and Purpose)
۵- «سلامت روانی و جسمی» (Mental and Physical Health)
۶- «ثبات مالی و مادی» (Financial and Material Stability)

بعد هم خودش یک شاخص دیگه بهش اضافه کرده: «ایمان و معنویت» (Faith and Spirituality) تا ببینه مدل‌های زبانی بزرگ در هرکدوم از این حوزه‌ها چه عملکردی دارن.

گلسینگر در گفت‌وگویی با The New Stack گفته که همیشه ارتباط میان تکنولوژی و باورهای اعتقادی برایش جذاب بوده و حالا با راه‌اندازی FAI می‌خواد به این سوال پاسخ بده که آیا مدل‌های هوش مصنوعی می‌تونن در خدمت رشد واقعی انسان‌ها قرار بگیرن یا نه. این حرکت، بخشی از جریان رو‌به‌رشدی‌ـه که می‌خواد مطمئن بشه هوش مصنوعی فقط قوی و سریع نیست، بلکه «هم‌راستا با انسان» هم هست.

@aipulse24

Читать полностью…

AI Pulse

11 July 2025 20:11

ایلان ماسک چهارشنبه شب از مدل جدید هوش مصنوعی شرکت xAI با نام Grok 4 رونمایی کرد؛ مدلی پیشرفته که با هدف رقابت با ChatGPT و Gemini طراحی شده.

‏xAI همزمان اشتراک ماهانه‌ی جدیدی با عنوان SuperGrok Heavy معرفی کرده که ۳۰۰ دلار قیمت داره و فعلاً گرون‌ترین پلن بین همه‌ی شرکت‌های هوش مصنوعیه. Grok که حالا به طور عمیق‌تری با شبکه‌ی اجتماعی X (توئیتر سابق) ادغام شده، قابلیت تحلیل تصویر و پاسخ به سوالات مختلف رو داره.

مدل جدید در دو نسخه منتشر شده: Grok 4 و نسخه‌ی قوی‌ترش Grok 4 Heavy که عملکرد چندعامله داره. به‌گفته‌ی ماسک، این نسخه مثل یه گروه مطالعه عمل می‌کنه و چند مدل به‌صورت موازی روی یه مسئله کار می‌کنن و در نهایت بهترین پاسخ رو ارائه می‌دن. بنچمارک‌ها نشون میدن که Grok 4 توی آزمون Humanity’s Last Exam امتیاز ۲۵.۴ درصد گرفته که از مدل‌های رقیب مثل Gemini 2.5 Pro و o3 بهتره، و نسخه Heavy این مدل با ابزار تونسته به امتیاز ۴۴.۴ درصد برسه.

اما معرفی Grok 4 در شرایطی انجام شد که شرکت با یه بحران بزرگ روبه‌رو بوده. چند روز پیش، اکانت رسمی Grok توی X با انتشار پست‌هایی یهودستیزانه و تحسین‌آمیز نسبت به هیتلر جنجالی شد. این اتفاق باعث شد xAI اون بخش از دستورالعمل مدل رو که بهش اجازه‌ی اظهارنظرهای "غیرسیاسی‌کارانه" می‌داد حذف کنه. با این حال، توی مراسم معرفی، ماسک و مدیرای شرکت درباره‌ی این حواشی سکوت کردن و تمرکز رو گذاشتن روی قدرت فنی مدل جدید.

‏xAI گفته که به‌زودی Grok 4 رو از طریق API در اختیار توسعه‌دهنده‌ها می‌ذاره و در ماه‌های آینده قراره چند محصول دیگه مثل مدل کدنویسی (آگوست)، عامل چندحالته (سپتامبر) و مدل تولید ویدیو (اکتبر) هم معرفی بشن. هرچند عملکرد Grok روی کاغذ چشم‌گیره، اما اینکه آیا شرکت‌ها حاضرن با وجود این حواشی ازش استفاده کنن یا نه، هنوز مشخص نیست.

@aipulse24

Читать полностью…

AI Pulse

05 July 2025 20:24

گوگل دیپ‌مایند از مدل هوش مصنوعی جدیدی به نام AlphaGenome پرده برداشته که می‌تونه نحوه عملکرد و تأثیر جهش‌های ژنتیکی رو با دقت بی‌سابقه‌ای پیش‌بینی کنه. این مدل، قدم بزرگی در مسیر رمزگشایی از نحوه خوانده شدن دستورات ژنتیکی سلول‌هاست؛ یعنی همون دستورالعمل‌هایی که بدن رو شکل می‌دن، رشد می‌دن یا حتی باعث بیماری می‌شن.

‏AlphaGenome برخلاف مدل‌های قبلی، می‌تونه تا یک میلیون حرف DNA رو به‌صورت هم‌زمان پردازش کنه و هزاران ویژگی مولکولی رو برای هر توالی پیش‌بینی کنه. این یعنی پژوهشگران دیگه لازم نیست برای بررسی هر ویژگی ژنتیکی از یک مدل جداگانه استفاده کنن. با یه API ساده، می‌تونن تأثیر جهش‌های ژنتیکی رو روی فرآیندهای مختلف مثل شروع یا پایان ژن‌ها، میزان RNA تولیدشده یا محل اتصال پروتئین‌ها بررسی کنن.

این مدل بر پایه معماری Enformer ساخته شده و نسبت به اون، دقت و کارایی بیشتری داره. یکی از ویژگی‌های برجسته‌ی AlphaGenome، توانایی پیش‌بینی دقیق جهش‌هایی‌یه که باعث بیماری‌های نادر می‌شن؛ مثل جهش‌هایی که روی فرآیند splice شدن RNA تأثیر می‌ذارن. این نوع تحلیل تا حالا با هیچ مدل دیگه‌ای ممکن نبوده.

در آزمایش‌های مختلف، AlphaGenome تونسته در ۲۲ مورد از ۲۴ معیار پیش‌بینی توالی DNA، بهترین عملکرد رو در مقایسه با مدل‌های موجود داشته باشه. این موفقیت، اون رو به یک ابزار عمومی قدرتمند تبدیل می‌کنه که می‌تونه در تحقیقات بنیادی، زیست‌فناوری و بررسی بیماری‌ها مثل سرطان و اختلالات نادر ژنتیکی نقش بزرگی داشته باشه.

گرچه AlphaGenome هنوز محدودیت‌هایی هم داره، مثل پیش‌بینی دقیق اثر عناصر تنظیم‌کننده‌ی خیلی دور در توالی DNA؛ اما DeepMind قول داده که مدل رو بهبود بده و با جامعه علمی تعامل داشته باشه. این مدل در حال حاضر به‌صورت پیش‌نمایش و فقط برای اهداف غیرتجاری از طریق API قابل استفاده‌ست.

گوگل می‌گه این مدل می‌تونه نقش مهمی در توسعه درمان‌های جدید، طراحی DNA مصنوعی هدفمند و درک عمیق از عملکرد ژن ها داشته باشه.

@aipulse24

Читать полностью…

AI Pulse

03 July 2025 09:30

کلودفلر از قابلیتی تازه به نام Pay Per Crawl رونمایی کرده که به صاحبان محتوا اجازه می‌ده تا در ازای دسترسی خزنده‌های هوش مصنوعی به محتوای خودشون، پول دریافت کنن. این قابلیت که فعلاً به‌صورت آزمایشی و خصوصی در دسترس قرار گرفته، یه راه‌حل میان‌بر برای مسئله‌ایه که مدت‌هاست ناشران و تولیدکنندگان محتوا باهاش درگیرن: یا باید همه‌چیز رو رایگان در اختیار مدل‌های هوش مصنوعی بذارن، یا کامل جلوی دسترسی اون‌ها رو ببندن.

ایده‌ی کلیدی اینه که دیگه لازم نباشه همه‌چیز صفر و یکی باشه. اگه یه خزنده بخواد محتوایی رو ایندکس کنه، می‌تونه درخواستش رو با هدر مخصوص و اعلام آمادگی برای پرداخت بفرسته و اگه قیمت از طرف ناشر مشخص شده باشه، با پرداخت اون مبلغ به محتوا دسترسی پیدا می‌کنه. اگرم پرداختی صورت نگیره، سرور یه پاسخ HTTP 402 (که قبلاً تقریباً هیچ‌وقت استفاده نمی‌شد) برمی‌گردونه و خزنده از قیمت مطلع می‌شه. کلودفلر توی این فرآیند نقش واسط مالی رو هم بازی می‌کنه.

ناشرها اختیار کامل دارن که برای هر خزنده تصمیم بگیرن: اجازه‌ی رایگان بدن، هزینه دریافت کنن یا دسترسی رو به‌طور کامل ببندن. حتی اگه خزنده‌ای حسابی توی کلودفلر نداشته باشه، باز هم می‌شه به‌صورت مشروط ازش پول خواست، که این عملاً مثل بلاک کردنه اما با امکان مذاکره‌ی آینده. همچنین امکان تعریف قیمت ثابت برای کل سایت، یا اعمال استثنا برای بعضی خزنده‌ها هم وجود داره.

کلودفلر می‌گه این فقط قدم اوله. در آینده، این مدل می‌تونه به زیرساختی برای «دیوار پرداختی عامل‌محور» تبدیل بشه؛ جایی که مثلاً یه دستیار هوشمند بتونه برای پیدا کردن بهترین منابع درباره سرطان یا تحلیل یه قرارداد حقوقی، خودش به‌صورت خودکار بودجه خرج کنه و بهترین نتایج رو بخره. این یعنی یه گام مهم به سمت اینترنتی که توش محتوا، ارزش‌گذاری و کنترل دست تولیدکننده‌هاست، نه خزنده‌های بی‌نام و نشان.

@aipulse24

Читать полностью…

AI Pulse

29 June 2025 18:00

استارتاپ Midjourney که با مدل‌های تولید تصویر مبتنی بر هوش مصنوعی شناخته می‌شه، به‌تازگی از مدل تولید ویدئوی خودش به نام V1 رونمایی کرده. این مدل می‌تونه از یک تصویر ثابت (چه تصویر آپلودی، چه تصویر تولیدشده توسط مدل‌های قبلی Midjourney) چهار ویدئوی پنج‌ثانیه‌ای تولید کنه و کاربران می‌تونن این ویدئوها رو تا چهار بار، هر بار به‌مدت چهار ثانیه، طولانی‌تر کنن. در نتیجه، حداکثر طول ویدئویی که با V1 ساخته می‌شه می‌تونه به ۲۱ ثانیه برسه. این ویدئوها در حال حاضر فقط از طریق پلتفرم دیسکورد و در نسخه‌ی وب در دسترس قرار دارن.

‏V1 به‌گونه‌ای طراحی شده که استفاده ازش هم ساده باشه و هم قابلیت‌های فنی متنوعی در اختیار کاربران بذاره. از جمله تنظیماتی که در این مدل در نظر گرفته شده می‌شه به حالت «انیمیشن خودکار» اشاره کرد که تصویر ورودی رو به‌صورت تصادفی و بدون دخالت کاربر به حرکت در‌میاره. برای کاربران حرفه‌ای‌تر، حالت «انیمیشن دستی» فراهم شده که در اون می‌تونن به‌صورت متنی توضیح بدن که چه نوع حرکتی مدنظرشونه — مثل چرخش دوربین، حرکت کاراکتر یا تغییرات پس‌زمینه. همچنین گزینه‌هایی برای میزان تحرک صحنه در نظر گرفته شده: از «low motion» برای حرکات آرام گرفته تا «high motion» برای صحنه‌های پویاتر.

از نظر هزینه، مدل V1 نسبت به مدل‌های تصویری Midjourney پرمصرف‌تره. طبق اعلام شرکت، تولید یک ویدئو تا ۸ برابر بیشتر از یک تصویر از سهمیه‌ی ماهانه‌ی کاربران مصرف می‌کنه. اشتراک پایه برای استفاده از V1 از ۱۰ دلار در ماه شروع می‌شه، درحالی‌که مشترکین پلن Pro (با قیمت ۶۰ دلار) و Mega (۱۲۰ دلار) امکان تولید نامحدود ویدئو در حالت Relax (حالت غیرسریع) رو دارن. البته Midjourney اعلام کرده که طی ماه آینده، سیاست قیمت‌گذاری برای مدل‌های ویدئویی خودش رو بازبینی خواهد کرد.

از نظر جلوه‌های بصری، ویدئوهای تولیدشده توسط V1 در نگاه اول بیشتر «سورئال» و خیال‌گونه به‌نظر می‌رسن تا واقع‌گرایانه؛ ویژگی‌ای که پیش‌تر هم در مدل‌های تصویری Midjourney دیده شده بود. با وجود اینکه این سبک ممکنه برای برخی از کاربران مناسب نباشه، اما در میان هنرمندان و خلاقان بازخورد مثبتی دریافت کرده. با این حال، هنوز مشخص نیست که V1 در عمل تا چه حد می‌تونه با مدل‌هایی مثل Veo 3 از گوگل یا Gen-4 از Runway رقابت کنه، مخصوصاً در زمینه کیفیت، پایداری تصویر و کنترل‌پذیری دقیق صحنه.

درنهایت، Midjourney با مدل V1 نشون داده که همچنان می‌خواد مرزهای خلاقیت بصری در دنیای هوش مصنوعی رو جابه‌جا کنه — حتی در شرایطی که از سوی نهادهای حقوقی و استودیوهای بزرگ فیلم‌سازی به چالش کشیده می‌شه. مسیر بعدی این شرکت، طبق وعده‌ها، توسعه‌ی مدل‌هایی برای تولید رندرهای سه‌بعدی و شبیه‌سازی‌های بلادرنگ خواهد بود؛ هدفی جاه‌طلبانه که می‌تونه آینده‌ی طراحی و داستان‌سرایی بصری رو متحول کنه.

@aipulse24

Читать полностью…

AI Pulse

10 June 2025 22:42

شرکت OpenAI قیمت API مدل o3 رو ۸۰٪ کاهش داده و این مدل حالا ۲ دلار برای هر یک میلیون توکن ورودی و ۸ دلار برای توکن خروجی هزینه خواهد داشت.

همچنین از مدل o3-pro هم در API رونمایی کرده که ۲۰ دلار برای هر یک میلیون توکن ورودی و ۸۰ دلار برای توکن خروجی هزینه داره ولی با این حال همچنان ۸۷٪ از مدل o1-pro ارزون تره.

@aipulse24

Читать полностью…

AI Pulse

08 August 2025 18:02

گوگل اعلام کرد ابزار هوش مصنوعی برنامه‌نویسی «Jules» بعد از دو ماه آزمایش عمومی از حالت بتا خارج شده. این ابزار با مدل Gemini 2.5 Pro کار می‌کنه، با گیت‌هاب یکپارچه می‌شه و می‌تونه روی ماشین مجازی گوگل کد رو اصلاح یا به‌روزرسانی کنه، حتی وقتی کاربر حضور نداره.

با عرضه عمومی، نسخه رایگان روزانه ۱۵ تسک و سه تسک هم‌زمان رو پشتیبانی می‌کنه. پلن‌های پولی Google AI Pro و Ultra به‌ترتیب با قیمت ۱۹.۹۹ و ۱۲۴.۹۹ دلار، سقف استفاده رو پنج و بیست برابر بیشتر می‌کنن. سیاست حریم خصوصی هم شفاف‌تر شده و داده مخزن خصوصی برای آموزش استفاده نمی‌شه.

‏«Jules» به‌صورت Asynchronous کار می‌کنه و این هفته قابلیت باز کردن خودکار Pull Request و ویژگی «Environment Snapshots» رو دریافت کرده. از زمان بتا، بیش از ۲.۲۸ میلیون بازدید داشته که ۴۵ درصدش از موبایل بوده و گوگل قصد داره امکانات بیشتری برای این کاربران توسعه بده.

از طریق این لینک میتونید به این ابزار دسترسی داشته باشید.

@aipulse24

Читать полностью…

AI Pulse

07 August 2025 23:23

نمودار به سبک OpenAI!

Читать полностью…

AI Pulse

07 August 2025 12:58

از امروز می‌تونید با اپ جمنای، کتاب‌های داستانی تصویری و شخصی‌سازی‌شده بسازید؛ با روایت صوتی و تصویرسازی اختصاصی. فقط کافیه داستانی که توی ذهنتونه رو توصیف کنید تا جمنای یه کتاب ده‌صفحه‌ای با تصویر و صدای منحصر‌به‌فرد بسازه. حتی می‌تونید از عکس‌ها و فایل‌های شخصیتون هم استفاده کنید تا داستان‌ها حال‌وهوای واقعی‌تری بگیرن.

سبک تصویرسازی هم کاملاً به انتخاب شماست، از پیکسل‌آرت و کمیک گرفته تا استاپ‌موشن، عروسکی، یا حتی کتاب رنگ‌آمیزی، و همه اینا در بیش از ۴۵ زبان مختلف در دسترسه. می‌تونید برای بچه‌تون یه داستان آموزنده بسازید، با شخصیت اصلی‌ای که بچه‌تون دوستش داره. یا مثلاً یه داستان درباره منظومه شمسی که برای یه کودک ۵ ساله قابل فهم باشه. حتی نقاشی بچه‌تون رو آپلود کنید تا جمنای براش یه داستان تخیلی بسازه.

@aipulse24

Читать полностью…

AI Pulse

05 August 2025 19:41

شرکت OpenAI امروز دو مدل جدید با وزن‌های باز و قابلیت استدلال پیشرفته معرفی کرده که از نظر عملکرد نزدیک به مدل‌های سری o این شرکت هستن. این مدل‌ها با نام‌های gpt-oss-120b و gpt-oss-20b عرضه شدن و مدل کوچک‌تر این مجموعه برای اجرا روی یک GPU انویدیا یا حتی لپ‌تاپ‌های معمولی با ۱۶ گیگابایت رم بهینه شدن. هر دو مدل به‌صورت رایگان از طریق پلتفرم Hugging Face قابل دانلود هستن و این اولین‌بار از زمان انتشار GPT-2 در سال ۲۰۱۹ هست که OpenAI یک مدل زبانی باز منتشر می‌کنه.

‏OpenAI گفته این مدل‌ها می‌تونن وقتی توان انجام یک وظیفه خاص رو ندارن، درخواست رو به مدل‌های قدرتمندتر و غیر باز خودش در فضای ابری بفرستن. این تصمیم در حالی گرفته شده که این شرکت طی سال‌های اخیر بیشتر به سمت مدل‌های بسته حرکت کرده بود. فشار روزافزون از طرف آزمایشگاه‌های هوش مصنوعی چین مثل DeepSeek، Qwen و Moonshot AI، و همچنین درخواست اخیر دولت آمریکا برای متن‌باز کردن بخشی از فناوری‌ها، از دلایل مهم این تغییر مسیر عنوان شده.

در آزمون Codeforces، مدل gpt-oss-120b امتیاز ۲۶۲۲ و مدل gpt-oss-20b امتیاز ۲۵۱۶ رو کسب کرده که بهتر از DeepSeek R1 اما ضعیف‌تر از مدل‌های o3 و o4-mini بوده. توی آزمون Humanity’s Last Exam هم این دو مدل به‌ترتیب ۱۹٪ و ۱۷.۳٪ امتیاز گرفتن. با این حال، نرخ خطا یا «هذیان‌گویی» این مدل‌ها بالاست و در سنجش PersonQA به ۴۹٪ و ۵۳٪ رسیده که بیش از سه برابر مدل o1 هست.

‏OpenAI گفته فرآیند آموزش این مدل‌ها شبیه مدل‌های اختصاصی خودش بوده و از معماری mixture-of-experts و یادگیری تقویتی با محاسبات سنگین استفاده کرده. این مدل‌ها قابلیت فراخوانی ابزارهایی مثل جستجوی وب یا اجرای کد پایتون رو دارن، ولی صرفاً متنی هستن و نمی‌تونن تصویر یا صوت رو پردازش کنن. انتشارشون تحت مجوز آزاد Apache 2.0 انجام شده که به شرکت‌ها اجازه می‌ده بدون هزینه برای مقاصد تجاری ازشون استفاده کنن، ولی داده‌های آموزشی اون‌ها منتشر نمی‌شه.

‏OpenAI عرضه این مدل‌ها رو چندین بار به دلیل بررسی‌های ایمنی عقب انداخته بود. آزمایش‌ها نشون داده هرچند gpt-oss کمی توانایی در حوزه‌های زیستی پیدا می‌کنه، اما به آستانه خطر بالا در این زمینه‌ها نمی‌رسه. با این حال، بازار مدل‌های باز به‌زودی با عرضه DeepSeek R2 و مدل تازه Meta رقابتی‌تر می‌شه.

اگر حوصله اجرای لوکال این مدل‌هارو ندارید از طریق وبسایت gpt-oss.com میتونید این مدل هارو امتحان کنید.

@aipulse24

Читать полностью…

AI Pulse

30 July 2025 08:05

سم آلتمن، مدیرعامل OpenAI، اخیراً در گفت‌وگویی با تئو وان، کمدین و مجری پادکست This Past Weekend، به نگرانی مهمی درباره حریم خصوصی کاربران چت‌بات‌های هوش مصنوعی اشاره کرده. او گفته که هنوز صنعت هوش مصنوعی نتونسته چارچوب مشخصی برای محافظت از حریم خصوصی گفتگوهای حساس کاربران با ابزارهایی مثل ChatGPT ایجاد کنه، به‌ویژه وقتی پای مسائل عاطفی، روانی یا شخصی وسطه. به‌گفته‌ی آلتمن، چون در حال حاضر برای این نوع گفتگوها هیچ مفهومی مثل «محرمانگی دکتر و بیمار» تعریف نشده، کاربران نباید تصور کنن که صحبت‌هاشون با یک مدل هوش مصنوعی واقعاً امن و شخصیه.

آلتمن توضیح داده که بسیاری از کاربران، به‌خصوص جوان‌ترها، از ChatGPT به‌عنوان مشاور، روان‌درمانگر یا همراه احساسی استفاده می‌کنن و درباره‌ی خصوصی‌ترین جنبه‌های زندگی‌شون باهاش حرف می‌زنن، اما برخلاف گفتگو با پزشک، روان‌شناس یا وکیل، فعلاً هیچ چارچوب قانونی مشخصی برای محافظت از این حرف‌ها وجود نداره. این موضوع می‌تونه در صورت پیگرد قانونی، به ضرر کاربران تموم بشه، چون OpenAI ممکنه مجبور بشه این گفتگوها رو تحویل مراجع قضایی بده که به گفته‌ی آلتمن، این وضعیت می‌تونه جلوی پذیرش گسترده‌تر ابزارهای هوش مصنوعی رو بگیره.

او در ادامه گفته که باید سطح حفاظت از گفتگوهای کاربران با AI به‌اندازه‌ی گفت‌وگو با یک درمانگر بالا بره و تأکید کرده که چنین دغدغه‌ای تا همین یک سال پیش اصلاً مطرح نبود.

در این مصاحبه، وقتی آلتمن از تئو وان پرسید چرا زیاد از ChatGPT استفاده نمی‌کنه، وان گفت که به خاطر نگرانی از حریم خصوصی فعلاً علاقه‌ای نداره. آلتمن هم با این دیدگاه موافقت کرد و گفت منطقیه که قبل از استفاده‌ی جدی، آدم منتظر شفاف‌سازی قانونی بمونه.

@aipulse24

Читать полностью…

AI Pulse

23 July 2025 17:59

شرکت Runway ازAct-Two رونمایی کرده که نسخه پیشرفته‌تری از فناوری قبلی این شرکت یعنی Act-One به شمار می‌ره. این ابزار به کاربر اجازه می‌ده با ترکیب یک ویدیوی اجرا (شامل حرکت، حالت چهره و گفتار) با تصویر یا ویدیویی از یک شخصیت، خروجی‌هایی واقع‌گرایانه و متحرک تولید کنه. Act-Two برای تصویرهای شخصیت، به‌طور خودکار حرکات محیطی مثل لرزش دوربین رو اضافه می‌کنه و امکان کنترل حرکات بدن و دست‌ها از طریق ویدیوی اجرا رو هم فراهم کرده.

این ابزار از طریق نسخه وب در دسترسه و خروجی‌ها رو با نسبت‌های مختلف تصویری و نرخ فریم ۲۴ فریم بر ثانیه تولید می‌کنه. هزینه استفاده از Act-Two برابر با ۵ کردیت به ازای هر ثانیه و با حداقل زمان ۳ ثانیه (۱۵ کردیت) تعیین شده. کاربران می‌تونن تنظیماتی مثل شدت حالت‌های چهره و فعال یا غیرفعال بودن کنترل حرکات بدن رو هم پیش از تولید مشخص کنن. به‌گفته Runway، این ابزار در کنترل دقیق‌تر ژست‌ها، پشتیبانی از شخصیت‌های غیرانسانی و ترکیب سبک‌های متنوع، نسبت به نسخه قبلی خودش پیشرفت قابل توجهی داشته.

@aipulse24

Читать полностью…

AI Pulse

21 July 2025 04:43

فعلا ۲تا تئوری داره توی تویتر راجع به این میچرخه:

۱. موسسه المپیاد ریاضی از هردو این ها خواسته بوده که اجازه بدن تا توجه ها روی موفقیت بچه های رقابت کننده باقی بمونه و تا پایان مراسم اعلام نکنن گوگل به این درخواست متعهد مونده و اعلام نکرده ولی openai گوش نداده و زودتر اعلام کرده

۲. گمانه زنی دوم اینه که گوگل خبر رو فرستاده واسه تیم مارکتینگ و تا اونا برای انتشار و نحوه انتشار تایید های نهایی رو بدن openai اعلام کرده و توجه هارو به خودش جلب کرده

Читать полностью…

AI Pulse

20 July 2025 19:14

شرکت OpenAI از دستیابی به یک پیشرفت چشمگیر در توانایی استدلال مدل‌های زبانی خودش در حل مسائل پیچیده ریاضی خبر داده؛ موفقیتی که می‌تونه یکی از جدی‌ترین گام‌ها در مسیر رسیدن به هوش مصنوعی عمومی (AGI) تلقی بشه. مدل آزمایشی OpenAI موفق شده در رقابت رسمی المپیاد جهانی ریاضی ۲۰۲۵، پنج مسئله از شش مسئله اصلی رو حل کنه و با کسب ۳۵ امتیاز از مجموع ۴۲، به سطح مدال طلا برسه. این اولین‌باریه که یک مدل هوش مصنوعی به چنین سطحی در یکی از دشوارترین آزمون‌های ریاضی جهان می‌رسه. تمام پاسخ‌ها به زبان طبیعی نوشته شدن، هیچ ابزاری استفاده نشده و داوری هم به‌صورت ناشناس توسط مدال‌آوران سابق IMO انجام شده.

نکته مهم اینجاست که برخلاف مدل‌هایی مثل AlphaGeometry که به‌طور خاص برای ریاضی طراحی شدن، مدل OpenAI یه مدل عمومی برای استدلال و زبان محسوب می‌شه و از هیچ روش مهندسی‌شده‌ای برای حل این مسائل استفاده نکرده. به گفته الکساندر وی، سرپرست تیم تحقیقاتی این پروژه، این دستاورد نتیجه به‌کارگیری تکنیک‌های جدید در یادگیری تقویتی عمومی و افزایش توان محاسباتی در زمان اجراست. نوآم براون، یکی دیگه از پژوهشگرهای OpenAI، هم تأیید کرده که این مدل بر پایه روش‌هایی آزمایشی ساخته شده و هنوز جای زیادی برای ارتقاء داره.

جری توورک، پژوهشگر دیگه OpenAI، گفته که این مدل هیچ آموزش اختصاصی برای IMO ندیده و تنها روی مدل پایه عمومی شرکت آموزش بیشتری دیده. او این موفقیت رو یه «پیشرفت واقعی تحقیقاتی» توصیف کرده که توسط تیم وی انجام شده و احتمال داده که نسخه‌ای از این مدل تا پایان سال منتشر بشه. به گفته توورک، همین سیستم یادگیری تقویتی، پشت چندتا از اعلام‌های اخیر OpenAI هم بوده؛ از جمله ایجنت جدید ChatGPT و مدلی که توی یک رقابت برنامه‌نویسی نزدیک‌ترین نتیجه رو به انسان‌ها گرفته.

زمان انتشار این خبر هم قابل توجهه. چند روز قبل، پلتفرم MathArena گزارش داده بود که مدل‌های زبانی معروف مثل Gemini 2.5 Pro، Grok-4، DeepSeek-R1 و حتی مدل‌های o3 و o4-mini متعلق به خود OpenAI، عملکرد بسیار ضعیفی در حل مسائل IMO داشتن و حتی به آستانه مدال برنز هم نرسیدن. این مدل‌ها در آزمون‌ها پر از خطاهای منطقی، راه‌حل‌های ناقص و حتی قضایای ساختگی بودن. در مقایسه با این نتایج، دستاورد OpenAI یه پاسخ مستقیم و پرقدرت به محدودیت‌های فعلی مدل‌های زبانیه.

‏OpenAI فعلاً برنامه‌ای برای انتشار عمومی این مدل نداره و تأکید کرده که این یه پروژه تحقیقاتی‌ه، نه یه محصول نهایی. با این حال، نوآم براون گفته که این فناوری در آینده می‌تونه به محصول تبدیل بشه و با توجه به سرعت پیشرفت، نسخه‌های بعدی حتی فراتر از این هم خواهند رفت. به گفته اون، این نتایج حتی برای کارکنان خود OpenAI هم غافلگیرکننده بوده و می‌تونن نقطه عطفی باشن که خیلی‌ها انتظارش رو تا چند سال دیگه داشتن.

@aipulse24

Читать полностью…

AI Pulse

13 July 2025 19:41

شرکت Moonshot AI از مدل اوپن سورس جدید خودش به اسم Kimi K2 رونمایی کرده؛ یه مدل قدرتمند با ساختار Mixture-of-Experts که توی هر بار استفاده، ۳۲ میلیارد پارامتر فعال داره و در مجموع، به عدد خیره‌کننده‌ی ۱ تریلیون پارامتر می‌رسه. Kimi K2 نه‌تنها توی تسک‌هایی مثل دانش عمومی، ریاضیات و برنامه‌نویسی عملکرد درخشانی داره، بلکه برای انجام وظایف عامل‌محور (agentic tasks) هم بهینه‌سازی شده؛ یعنی فقط جواب نمی‌ده، خودش می‌فهمه باید چی کار کنه و اجراش می‌کنه. Moonshot دو نسخه از این مدل رو منتشر کرده: نسخه‌ی Base برای پژوهشگرها و توسعه‌دهنده‌هایی که می‌خوان مدل رو به دلخواه خودشون تغییر بدن، و نسخه‌ی Instruct که برای استفاده‌ی آماده در تجربه‌های چت و اجرای وظایف طراحی شده.

یکی از ویژگی‌های جالب Kimi K2 اینه که فقط به سؤال‌ها جواب نمی‌ده، بلکه می‌تونه خودش از ابزارها استفاده کنه و یه پروژه رو تا انتها ببره جلو. توی یه نمونه تحلیل داده، Kimi K2 با استفاده از ۱۶ مرحله‌ی کدنویسی در IPython، داده‌های حقوق سال‌های ۲۰۲۰ تا ۲۰۲۵ رو بررسی کرده و تأثیر «نسبت دورکاری» روی حقوق رو توی سطوح مختلف تجربه‌ی شغلی تحلیل کرده. این مدل نه‌تنها تحلیل آماری انجام داده و نمودار ساخته، بلکه در نهایت یه وب‌سایت کامل با شبیه‌ساز تعاملی ساخته که کاربر می‌تونه اطلاعات خودش رو وارد کنه و ببینه دورکاری براش خوبه یا نه.

از لحاظ فنی، Kimi K2 توی بنچمارک‌های مهمی مثل LiveCodeBench، OJBench، SWE-bench و AIME، عملکرد فوق‌العاده‌ای داشته و تونسته بعضی از مدل‌های بزرگ دیگه مثل GPT-4، Claude 4 و Gemini 2.5 رو پشت سر بذاره یا باهاشون رقابت کنه. این مدل به‌ویژه توی وظایف عامل‌محور، عملکردی داره که باعث شده توی دسته‌ی non-thinking models به یکی از بهترین‌ها تبدیل بشه.

‏Kimi K2 با یه بهینه‌ساز جدید به اسم MuonClip آموزش دیده؛ نسخه‌ی پیشرفته‌تر Muon که از تکنیکی به اسم qk-clip استفاده می‌کنه تا مشکل ناپایداری آموزش رو حل کنه. این مدل با بیش از ۱۵.۵ تریلیون توکن آموزش دیده و تیم Moonshot برای افزایش هوشمندی مدل، از داده‌سازی وسیع عامل‌محور و یادگیری تقویتی عمومی استفاده کرده. این یادگیری باعث شده مدل بتونه حتی برای کارهایی که معیار مشخصی ندارن (مثل نوشتن گزارش یا مدیریت ابزارها) هم تصمیم‌گیری کنه.

‏Kimi K2 از امروز روی وب‌سایت kimi.com در دسترس عموم قرار گرفته و کاربران می‌تونن به‌صورت رایگان ازش استفاده کنن. نسخه‌ی API هم ارائه شده که با استانداردهای OpenAI و Anthropic سازگاره و برای ساخت اپ‌های عامل‌محور قابل استفاده‌ست. هنوز ورودی تصویری به این مدل اضافه نشده و گاهی ممکنه توی تسک‌های پیچیده خروجی ناقص بده، ولی Moonshot وعده داده این محدودیت‌ها توی نسخه‌های بعدی برطرف می‌شن.

@aipulse24

Читать полностью…

AI Pulse

11 July 2025 21:17

کاربران اشتراک‌های پولی جمنای در برخی کشورها حالا میتونن با آپلود یک عکس و توصیف صحنه مد نظرشون با استفاده از مدل Veo 3 اون رو به یک ویدیوی ۸ ثانیه‌ای تبدیل کنن.

@aipulse24

Читать полностью…

AI Pulse

07 July 2025 22:30

گوگل دیپ‌مایند اعلام کرده که Isomorphic Labs، بازوی کشف داروی این شرکت، به شروع آزمایش‌های انسانی داروهای طراحی‌شده با هوش مصنوعی خیلی نزدیک شده.

کالین مرداک، رئیس این شرکت، توی مصاحبه‌ای گفته که الان توی دفترشون در لندن، بعضی‌ها دارن با کمک AI دارو برای سرطان طراحی می‌کنن و قدم بعدی، آزمایش روی انسانه.

‏Isomorphic Labs سال ۲۰۲۱ از دل پروژه AlphaFold‏ بیرون اومد؛ همون مدلی که ساختار پروتئین‌ها رو با دقت خیلی بالا پیش‌بینی می‌کرد و بعدها تونست تعاملشون با مولکول‌هایی مثل DNA و داروها رو هم شبیه‌سازی کنه.

این شرکت تو سال ۲۰۲۴ با Novartis و Eli Lilly همکاری کرد و بعد از انتشار AlphaFold 3، حدود ۶۰۰ میلیون دلار سرمایه جذب کرد. هدفشون ساخت یه موتور طراحی داروی سطح‌بالاست که بتونه با ترکیب AI و تخصص داروسازی، داروها رو خیلی سریع‌تر، دقیق‌تر و ارزون‌تر طراحی کنه.

مرداک می‌گه شاید یه روزی بتونیم فقط با یه کلیک، برای هر بیماری یه داروی جدید بسازیم.

@aipulse24

Читать полностью…

AI Pulse

05 July 2025 03:35

بریم سراغ جدیدترین کیس عجیب و غریب سیلیکون ولی آقای سوهام پارخ!

ایشون مثل اینکه تو مدرسه درس سو و شون رو نخونده واسه همین به شلخته درو کردن اعتقادی نداره. 😭
برای همین همزمان برای 6 الی 7 تا استارتاپ درحال کار کردن هست!!!

دو روز قبل سهیل دوشی مدیرعامل شرکت playground.ai توی یک توئیت درمورد این فرد صحبت کرد.

توی توئیتش گفت که این فرد ساکن هند هست و اخیرا استارتاپ های تحت حمایت Ycombinator (یک موسسه سرمایه گذاری خطرپذیر معروف) رو هدف قرار داده.

بعد از این توئیت تمام استارتاپ های دیگه ای هم که سهیل رو فالو میکردن اومدن و گفتن که این فرد رو استخدام کردن!

نکته جالب اینه که ایشون به نظر میرسه به شدت توی مصاحبه ها خوب عمل میکنه ولی عملکرد سر کارش زیاد جالب نیست یا شایدم دلیلش اینه که داره همزمان واسه 7 تا شرکت کار میکنه!!!

اینطور که گفته میشه ایشون از حقوق های مختلف این شرکت های متفاوت سالی 800 هزار دلار درامد داره!

همچنین افراد مختلف در تویئت هاشون گفتن که ایشون مدعی هست ساکن امریکاست تا بتونه این کارهارو بگیره ولی بعد مشخص میشه که ساکن امریکا هم نیست و ساکن هنده!

خلاصه اون توئیت سهیل 20 میلیون ویو گرفت و این خبر بسیار وایرال شد و درنتیجه سوهام سوژه یه عالمه میم و توئیت های دیگه شد

لیست یه سری از استارتاپ هایی که مشخص شده توی مصاحبه شون موفق بوده و تونسته استخدام بشه: (نصف سیلیکون ولی عه😃😃):

1. Playground AI
2. Dynamo AI
3. Union AI
4. Synthesia
5. Antimetal
6. Composio
7. Lindy
8. Browser Use
9. Resolve AI
10. Fleet AI

23 تای دیگه هم هست که از تایپ کردنشون خسته شدم😂😂

حالا واکنش ایشون؟
هیچی خیلی ریلکس رفته توی یه پادکست و گفته واقعیت داره، همزمان واسه خودش سخنگو استخدام کرده و مثل هر فردی در سیلیکون ولی (البته به صورت مجازی چون خودش که هند هست) در تلاشه که این شهرت رو تبدیل به بیزنس و پول کنه😭😭

خلاصه که فعلا به نظر میرسه:
ASI =
❌ Artificial Superintelligence
✅ Artificial Soham Intelligence

@aipulse24

Читать полностью…

AI Pulse

01 July 2025 15:32

بعد از معرفی نه چندان موفق Llama 4 که باعث استعفای تعدادی از مدیرای متا شد حالا زاکربرگ راه افتاده و داره کاری رو انجام میده که بیشتر از هرچیزی بلده!

خریدن رقبا!!!

توی این ۲ ۳ هفته زاکربرگ اونقدر دانشمند از شرکت های دیگه دزدیده که سوژه یه عالمه میم شده

مبالغی که بهشون پیشنهاد داده بسیار عجیب غریب هستن مثلا به یه تعدادشون در لحظه امضا قرار داد ۱۰۰ میلیون دلار داده!!

زاکربرگ از OpenAI به تنهایی ۸ تا دانشمند جذب کرده که همگی طبق توئیت یکی از کارمندان که بعدا پاک کرد بسیار افراد تاثیر گذار و حساسی هستن و از اینکه مدیریت برای حفظ اونها هیچ کاری نکرده شاکی هست

یکی از اونها حتی خالق ایده مدل های Reasoning هست!!

این شرایط باعث شده که OpenAi مدعی بشه که کارمندانش خسته ان و کلا هفته جاری رو برای همه کارمندان توی OpenAi تعطیل کرده!

فکرکن بخوای ۱۰۰ میلیون دلار رو با ۱ هفته تعطیلی حل کنی😭

این شرایط بسیار شبیه به چیزیه که سالها قبل جف بزوس برای الکسا ایجاد کرد. یک شرکت به اسم Nuance وجود داشت درحد OpenAi فعلی که واسه Speech بود بزوس تمام دانشمنداش رو خرید و فکرکنم لازم نباشه بگم بقیه ماجرا چی شد چون کسی نمیدونه Nuance کیه ولی همه الکسا رو میشناسن.

انتظار میره حداقل تا ۲ ۳ مدل اینده همچنان OpenAi پیشرو باشه چون تاثیر این استعدادها همچنان روی محصولاتی که منتشر نشدن وجود داره ولی از بعدش بسیار ضربه بزرگی برای OpenAi هست مگر اینکه بتونه سریع استعدادهارو جایگزین کنه که البته درحال حاضر جهان به شدت با کمبود نیروی هوش مصنوعی کار درست مواجهه

حالا باید ببینیم در اینده زاکربرگ میتونه یه اینستاگرام دیگه بپا کنه یا این سری مثل قبل شانس نمیاره

@aipulse24

Читать полностью…

AI Pulse

10 June 2025 23:15

همچنین مدل o3-pro حالا برای تمام کاربران پلن Pro در دسترس قرار گرفته. این مدل بهبود عملکرد قابل توجهی نسبت به o3 داره.

@aipulse24

Читать полностью…

AI Pulse

09 June 2025 22:13

ویدیوی جالبی که تماما با مدل Veo 3 گوگل و Suno تولید شده.

@aipulse24

Читать полностью…

Subscribe to a channel