3657
اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
امار امسال کانال
با تشکر ویژه از اسپانسر اصلی ما
کانال تک تیوب:))
و محمد با پست های فوق العاده اش😊
گوگل بهتازگی از یک مرورگر آزمایشی و متفاوت به نام «دیسکو» (Disco) رونمایی کرده که قرار نیست جایگزین کروم بشه، بلکه قراره نحوه تعامل ما با وب رو از طریق هوش مصنوعی متحول کنه.
این پروژه که از دل یکی از هکاتونهای داخلی گوگل بیرون اومده، حول محور ایدهای به نام GenTabs میچرخه؛ قابلیتی که به جای ارائه لیست سادهای از لینکها یا متن، بر اساس درخواست کاربر یک مینیاپلیکیشن سفارشی و تعاملی میسازه. مثلاً اگه ازش برای برنامهریزی سفر کمک بخواین، یه رابط کاربری کامل شامل نقشه، زمانبندی و لیست جاذبهها براتون طراحی میکنه که کاملاً شخصیسازی شده باشه.
فناوری اصلی پشت دیسکو، مدل هوش مصنوعی Gemini 3 هست که توانایی ساخت رابطهای کاربری لحظهای رو داره. وقتی کاربر یک «پروژه» جدید ایجاد میکنه و درخواستی رو تایپ میکنه، دیسکو همزمان هم تبهای مرتبط رو باز میکنه و هم یک GenTab میسازه که اطلاعات رو به شکل تعاملی نمایش میده. نکته کلیدی اینجاست که این سیستم یکطرفه نیست؛ یعنی اگه کاربر خودش تبهای جدیدی باز کنه و اطلاعات بیشتری به پروژه اضافه کنه، GenTab بهصورت هوشمند آپدیت میشه و اون دادههای جدید رو هم در برنامه نهایی بگنجونه تا نتیجه کار دقیقتر و کاملتر باشه.
تیم توسعهدهنده دیسکو تأکید داره که هدف این مرورگر حذف وبگردی نیست، بلکه برعکس، تلاش میکنه کاربر رو به باز کردن سایتها و بررسی منابع تشویق کنه تا هوش مصنوعی بتونه بر اساس اونها محتوا بسازه. هنوز مشخص نیست که آیا دیسکو و قابلیتهای GenTabs در آینده به عنوان یک محصول مستقل باقی میمونن یا به بخشی از کروم و سرویسهای گوگل ورکاسپیس تبدیل میشن، اما این آزمایش نشون میده که گوگل به دنبال ترکیب کردن مفهوم مرورگر وب با ابزارهای تولید محتواست تا مرز بین جستجو و خلق کردن رو کمرنگ کنه.
@aipulse24
تصویر ساخته شده توسط یکی از اعضای کانال.
تکست رندرینگ و consistency مدل شگفت انگیزه.
@aipulse24
مدل Nano Banana Pro به ابراز NotebookLM هم اضافه شده و حالا میتونه اینفوگرافیک مرتبط با منابعی که آپلود کردید براتون تولید کنه.
@aipulse24
نمونه تصاویر تولید شده با Nano Banana Pro 🍌
@aipulse24
مدل کارد منتسب به Gemini 3 Pro چند ساعت قبل از رونمایی رسمی.
@aipulse24
گوگل مدل هوش مصنوعی Gemma رو از پلتفرم AI Studio حذف کرده، درست بعد از اینکه سناتور جمهوریخواه «مارشا بلکبرن» اعلام کرده این مدل دربارهاش اتهامهای ساختگی منتشر کرده. گوگل گفته Gemma از ابتدا برای توسعهدهندهها طراحی شده بود و نباید برای پاسخ به پرسشهای واقعی یا استفاده عمومی به کار میرفته. با این حال به گفتهی شرکت، برای جلوگیری از این سوءبرداشت، دسترسی به Gemma در AI Studio قطع شده، اما همچنان از طریق API در اختیار توسعهدهندهها قرار داره.
بلکبرن در نامهای به ساندار پیچای، مدیرعامل گوگل، این شرکت رو به افترا و سوگیری ضدمحافظهکارانه متهم کرده. او گفته Gemma در پاسخ به پرسشی درباره خودش، داستانی دروغین از رابطه غیراخلاقی و اتهام تجاوز ساخته و حتی لینکهای جعلی به خبرهایی که اصلاً وجود نداشتن داده. بلکبرن تأکید کرده هیچکدوم از این ادعاها واقعیت ندارن و این کار، افترا از سوی یک مدل هوش مصنوعی متعلق به گوگل محسوب میشه.
گوگل اعلام کرده همچنان برای کاهش خطاها و «توهمات هوش مصنوعی» تلاش میکنه. این اتفاق بار دیگه نشون داده مدلهای هوش مصنوعی هنوز با مشکل دقت و تولید اطلاعات نادرست روبهرو هستن. بلکبرن هم در واکنشش گفته: «تا وقتی نمیتونید کنترلش کنید، خاموشش کنید.»
@aipulse24
گوگل در همکاری با دانشگاه ییل از مدل جدیدی به نام Cell2Sentence-Scale 27B (C2S-Scale) رونمایی کرده؛ مدلی با ۲۷ میلیارد پارامتر که برای درک «زبان سلولها» طراحی شده. این مدل بر پایهی خانواده مدلهای باز Gemma ساخته شده و مرز جدیدی در تحلیل سلولهای منفرد به شمار میره. اهمیت این دستاورد زمانی دوچندان میشه که C2S-Scale تونسته یک فرضیهی جدید درباره رفتار سلولهای سرطانی مطرح کنه که بعدتر با آزمایش روی سلولهای زنده هم تأیید شده؛ نتیجهای که مسیر تازهای برای درمانهای احتمالی سرطان باز میکنه.
این مدل برای حل یکی از چالشهای مهم ایمنیدرمانی سرطان یعنی نامرئی بودن تومورها برای سیستم ایمنی (تومورهای «سرد») به کار گرفته شده. C2S-Scale با شبیهسازی اثر بیش از ۴۰۰۰ دارو، دارویی به نام سیلمیتاسرتیب (Silmitasertib) رو شناسایی کرده که در حضور مقدار کم پروتئین سیگنالدهندهی اینترفرون، باعث افزایش چشمگیر نمایش آنتیژن روی سطح سلولها میشه؛ اتفاقی که تومور رو برای سیستم ایمنی «قابل دیدنتر» میکنه. آزمایشهای بعدی در سلولهای انسانی هم این پیشبینی رو تأیید کرده و نشون داده ترکیب سیلمیتاسرتیب با اینترفرون میتونه تا حدود ۵۰٪ میزان نمایش آنتیژن رو افزایش بده.
این موفقیت نهتنها یک کشف علمی مهم به حساب میاد، بلکه الگویی تازه برای نحوهی استفاده از مدلهای بزرگ در زیستشناسی ارائه میده. گوگل و ییل معتقدن این رویکرد میتونه روند کشف داروهای جدید و طراحی درمانهای ترکیبی رو سرعت بده. مدل و ابزارهای مرتبط با C2S-Scale 27B از امروز برای جامعه پژوهشی در دسترس قرار گرفته و روی پلتفرمهایی مثل Hugging Face و GitHub قابل استفادهست.
همچنین نسخه کامل این مقاله رو میتونید از اینجا مشاهده کنید.
@aipulse24
گوگل دیپمایند از مدل جدید «Gemini 2.5 Computer Use» رونمایی کرده که به هوش مصنوعی اجازه میده کارها رو درست مثل انسانها در محیطهای گرافیکی انجام بده، یعنی بتونه کلیک کنه، بنویسه و بین صفحات وب یا اپها جابهجا بشه. این مدل که بر پایهی تواناییهای دیداری و استدلالی Gemini 2.5 Pro ساخته شده، عملکرد خیلی بهتری نسبت به رقبا داره و با تأخیر کمتر اجرا میشه. توسعهدهندهها میتونن از طریق Gemini API در Google AI Studio یا Vertex AI بهش دسترسی پیدا کنن.
مدل جدید برای کنترل مرورگرها بهینه شده و در تستهای مختلف مثل Online-Mind2Web و WebVoyager نتایج خوبی گرفته. گوگل میگه این مدل میتونه فرمها رو پر کنه، فیلترها و منوها رو مدیریت کنه و حتی با فرم های لاگین کار کنه. همچنین ابزارهای ایمنی درون مدل تعبیه شدن تا جلوی اقدامهای پرخطر مثل دور زدن کپچا یا کنترل سیستمهای حساس گرفته بشه.
گوگل از این مدل در پروژههایی مثل تست خودکار رابطهای کاربری، Firebase Testing Agent و قابلیتهای عاملمحور «AI Mode» در جستوجو استفاده کرده. حالا هم نسخهی پیشنمایش عمومی در دسترسه و توسعهدهندهها میتونن از طریق محیط تست Browserbase یا مستندات رسمی گوگل، کار باهاش رو شروع کنن.
@aipulse24
شرکت OpenAI با انتشار ویدیوی بالا رسما از مدل تولید ویدیوی Sora 2 رونمایی کرد.
@aipulse24
گوگل دیپمایند مدلهای جدید هوش مصنوعی خودش رو با نام Gemini Robotics 1.5 و Gemini Robotics-ER 1.5 معرفی کرده که توانایی رباتها رو در انجام کارهای پیچیده چندمرحلهای بالا میبره. به گفته کارولینا پارادا، مدیر بخش رباتیک دیپمایند، این مدلها به رباتها امکان میدن قبل از انجام کار، چند قدم جلوتر رو تصور کنن و حتی برای حل مسئله از جستجوی وب کمک بگیرن. برای نمونه، رباتها حالا میتونن لباسها رو بر اساس رنگ تفکیک کنن، چمدان رو متناسب با وضعیت آبوهوای لندن ببندن یا زباله و مواد قابل بازیافت رو بر اساس قوانین محلی مرتب کنن.
مدل Gemini Robotics-ER 1.5 محیط اطراف رو درک میکنه و با استفاده از ابزارهایی مثل گوگل سرچ اطلاعات تکمیلی رو پیدا میکنه، بعد اونها رو به دستورهای قابل فهم برای Gemini Robotics 1.5 تبدیل میکنه تا ربات بتونه مرحله به مرحله اجراشون کنه. این سیستم باعث میشه رباتها از یک دستور ساده فراتر برن و به حل مسائل واقعی در دنیای فیزیکی نزدیکتر بشن.
نکته مهم دیگه اینه که دیپمایند میگه این مدلها امکان انتقال مهارتها بین رباتهای مختلف رو فراهم میکنن. یعنی کاری که یک ربات مثل ALOHA2 یاد گرفته، میتونه روی رباتهای دیگه مثل Franka یا حتی ربات انساننمای Apollo هم بدون تغییر اجرا بشه. به این ترتیب، یک مدل میتونه چندین نوع ربات رو کنترل کنه و تجربهها بین اونها به اشتراک گذاشته بشه. فعلاً نسخه ER 1.5 از طریق Gemini API در دسترس توسعهدهندهها قرار گرفته، اما مدل اصلی Robotics 1.5 فقط در اختیار برخی شرکا خواهد بود.
@aipulse24
دمیس هاسابیس میگه اینکه بعضی رقبا مدلهای هوش مصنوعی فعلی رو «هوش در سطح دکترا» معرفی میکنن، حرف درستی نیست. به گفتهی اون، این سیستمها بعضی تواناییها دارن که در سطح دکترا حساب میشه، اما در کل «هوش عمومی» ندارن. نمونهاش هم اینه که همین چتباتهای امروزی اگه سؤال ساده ریاضی دبیرستانی یا حتی شمارش پایهای رو کمی متفاوت مطرح کنیم، ممکنه جواب اشتباه بدن؛ چیزی که برای یک سیستم AGI واقعی نباید ممکن باشه. هاسابیس پیشبینی میکنه برای رسیدن به چنین سطحی از هوش عمومی هنوز ۵ تا ۱۰ سال فاصله داریم.
اون یکی از کمبودهای اصلی رو «یادگیری پیوسته» میدونه؛ یعنی اینکه سیستم بتونه به صورت آنلاین چیز جدیدی یاد بگیره یا رفتارش رو سریع تنظیم کنه. به گفتهی هاسابیس، این قابلیتها هنوز در مدلهای فعلی وجود ندارن و شاید صرفاً بزرگتر کردن مدلها ما رو به اونجا نرسونه. احتمالاً هنوز یک یا دو جهش علمی مهم لازمه که به گفتهی اون در پنج سال آینده اتفاق میفته و مسیر رسیدن به AGI رو هموار میکنه.
@aipulse24
شرکت انتروپیک افزونه جدید Claude برای کروم رو بهصورت آزمایشی عرضه کرده تا کاربرها بتونن مستقیماً در مرورگر به Claude دستور بدن و کارهایی مثل مدیریت تقویم، نوشتن ایمیل یا پر کردن فرمها رو انجام بدن. به گفته انتروپیک، مرورگر-ایجنتهای هوش مصنوعی دیر یا زود به بخشی جداییناپذیر از کارهای روزمره تبدیل میشن، اما در عین حال خطرهای امنیتی بزرگی مثل prompt injection وجود داره؛ جایی که هکرها دستورهای مخفی رو در وبسایتها یا ایمیلها جاسازی میکنن تا Claude رو به انجام کارهای ناخواسته مثل پاک کردن ایمیلها یا انتقال داده حساس وادار کنن. آزمایشهای اولیه نشون داده که بدون محافظت، این حملهها میتونن با موفقیت بالایی اجرا بشن.
انتروپیک برای مقابله با این خطرها لایههای دفاعی مختلفی در نظر گرفته؛ از جمله تأیید کاربر قبل از انجام کارهای حساس، امکان محدود کردن دسترسی Claude به سایتها، مسدودسازی سایتهای پرریسک، و استفاده از مدلهای شناسایی الگوهای مشکوک. این اقدامات باعث شده نرخ موفقیت حملهها به طور قابل توجهی کاهش پیدا کنه. با این حال، شرکت تأکید کرده که هنوز باید با کمک کاربرهای آزمایشی نقاط ضعف باقیمونده شناسایی بشه. فعلاً این قابلیت فقط برای هزار نفر از کاربران پلن Max فعال شده و انتروپیک امیدوار هست با جمعآوری بازخورد و بهبود امنیت، بتونه در آینده این ابزار رو برای همه کاربران عرضه کنه.
@aipulse24
مدلهای Claude Opus 4 و 4.1 حالا قابلیتی پیدا کردن که بتونن در شرایط خاص و خیلی نادر، خودشون به یک گفتوگو پایان بدن. این قابلیت بیشتر برای مواقعیه که تعاملات کاربر با مدل، بهطور مداوم آسیبزننده یا همراه با سوءاستفاده باشه. این تصمیم بخشی از تحقیقات آزمایشی در زمینه «رفاه هوش مصنوعی» بوده، اما در عین حال به موضوعات گستردهتر مثل Alignment و ایمنسازی مدلها هم مربوط میشه.
توسعهدهندهها تأکید کردن که هنوز درباره وضعیت اخلاقی احتمالی مدلهای زبانی مطمئن نیستن، چه الان و چه در آینده. با این حال موضوع رو جدی گرفتن و همزمان با تحقیقات، دارن روی راهکارهای کمهزینه برای کاهش ریسکها کار میکنن. دادن حق پایان دادن به مکالمه در شرایط آسیبزننده، یکی از همین مداخلات پیشگیرانه حساب میشه.
در تستهای پیش از انتشار Claude Opus 4، بررسی اولیهای از نظر «رفاه مدل» انجام شد. نتایج نشون داده که این مدل تمایل قوی به دوری از آسیب داره، بهویژه در مواردی مثل درخواستهای مربوط به محتوای جنسی کودکان یا تلاش برای دسترسی به اطلاعاتی که میتونه منجر به خشونت یا تروریسم بشه. مدل در مواجهه با چنین درخواستهایی نشونههایی از ناراحتی نشون داده و وقتی امکان پایان دادن به گفتوگو براش فراهم بوده، اغلب این کار رو انجام داده.
این قابلیت جدید طوری طراحی شده که فقط در بدترین سناریوها فعال بشه؛ یعنی وقتی چند بار تلاش برای تغییر مسیر گفتوگو جواب نداده یا وقتی خود کاربر صراحتا درخواست پایان مکالمه کرده باشه. در چنین شرایطی، کاربر دیگه نمیتونه توی همون گفتوگو پیام جدیدی بفرسته، اما امکان شروع یک چت تازه یا حتی بازنویسی پیامهای قبلی برای ساخت چت جدید همچنان وجود داره. تیم سازنده هم گفته این ویژگی فعلاً آزمایشی حساب میشه و قرارِ براساس بازخورد کاربران، بهمرور اصلاح و بهبود پیدا کنه.
@aipulse24
گوگل هم با انتشار یک بهروزرسانی جدید برای جمنای، قابلیت حافظه خودکار رو فعال کرده که میتونه جزئیات و ترجیحات کاربر رو بهطور خودکار و بر اساس چت های قبلی به خاطر بسپره و برای شخصیسازی پاسخها استفاده کنه، بدون اینکه کاربر نیازی به یادآوری اونها داشته باشه.
این ویژگی که نسخه پیشرفتهتر قابلیت سال گذشتهست، به جمنای اجازه میده اطلاعات مربوط به پروژهها و علایق قبلی رو در پاسخها لحاظ کنه. برای مثال، اگر قبلاً از جمنای برای ایدهسازی یک کانال یوتیوب با محوریت فرهنگ ژاپن استفاده کرده باشید، ممکنه در آینده پیشنهاد تولید محتوای مرتبط با غذاهای ژاپنی رو بده.
این قابلیت بهطور پیشفرض فعاله، اما کاربر میتونه از طریق تنظیمات اپلیکیشن و بخش Personal Context گزینه Your past chats with Gemini رو خاموش کنه.
این قابلیت ابتدا برای مدل Gemini 2.5 Pro در بعضی کشورها فعال میشه و بعد به مرور برای مدل 2.5 Flash و مناطق دیگه هم ارائه میشه.
علاوه بر این، گوگل قابلیت جدید «چت موقت» رو معرفی کرده که باعث میشه مکالمهها در لیست چتهای اخیر یا Keep Activity ذخیره نشن و برای شخصیسازی مکالمات آینده یا آموزش مدلهای هوش مصنوعی گوگل استفاده نشن. این مکالمهها فقط ۷۲ ساعت نگهداری میشن و بعد حذف میشن. به گفته گوگل، این ویژگی برای پرسیدن سؤالات خصوصی یا جلوگیری از ارجاع جزئیات یک مکالمه در گفتوگوهای بعدی بسیار کاربردیه.
@aipulse24
کافیه 🎁 رو توی یک چت جدید توی ChatGPT وارد کنید (بدون هیچ متنی) تا به صورت اتوماتیک بعد از اپلود یه عکس براتون یک کلیپ کوتاه تولید کنه که به پیام هایی که با ChatGPT توی این یک سال ردو بدل کردید مربوطه
(البته اگر قابلیت Memory رو توی ChatGPT فعال کرده باشید)
کلیپ های تولیدی تون رو با ما توی کامنت ها به اشتراک بگذارید 😊
(کانال هایی که کپی میکنید توروقران کلیپ خودتون رو حداقل روش بگذارید این واسه خودمه با تشکر از بی وجدانی شما غیر بزرگواران)
ضمیمه به همون غیر بزرگواران:
میدونم ۲ ساعت دیگه همه جا پر میشه ولی مهم اونی که زودتر زده
@aipulse24
بلک فارست لبز به تازگی از خانواده جدید مدلهای تصویرساز خودش یعنی Flux 2 رونمایی کرده که پیشرفتهای چشمگیری نسبت به نسل قبل داشته.
این مدلهای جدید میتونن تصاویری با رزولوشن بالا تا ۴ مگاپیکسل تولید کنن، اما مهمترین ویژگیشون سیستم Multi-reference هست؛ یعنی کاربر میتونه تا ۱۰ تصویر رو همزمان به مدل بده تا کاراکترها، محصولات یا استایل بصری توی تمام خروجیها کاملاً یکدست و ثابت بمونه.
علاوه بر این، موتور رندر متن هم بازسازی شده تا تایپوگرافی، اینفوگرافیکها و طراحیهای رابط کاربری (UI) رو خیلی دقیقتر و تمیزتر از قبل دربیاره.
از نظر معماری فنی، فلاکس ۲ از یک ساختار هیبریدی استفاده میکنه که شامل مدل بینایی-زبانی "Mistral-3 24B" برای فهم دقیق متن و تصویر و یک ماژول "Rectified Flow Transformer" برای مدیریت منطق و چیدمان تصویره. این ترکیب باعث میشه جزئیات و متریالها خیلی دقیقتر ظاهر بشن.
این خانواده شامل چهار نسخه مختلفه: نسخه Flux 2 [pro] که قویترین مدل برای رقابت با سیستمهای بسته است و فقط از طریق API در دسترسه، و نسخه Flux 2 [flex] که برای توسعهدهندهها طراحی شده تا بتونن سرعت و کیفیت رو خودشون تنظیم کنن.
نسخه محبوبتر برای جامعه متنباز، Flux 2 [dev] هست؛ یک مدل ۳۲ میلیارد پارامتری که وزنهای اون (Weights) روی Hugging Face منتشر شده. این مدل تولید تصویر و ویرایش رو یکجا انجام میده و نسخه بهینهشدهش (fp8) حتی روی کارتهای گرافیک مصرفی مثل سری RTX انویدیا هم به خوبی اجرا میشه (البته استفاده تجاری ازش نیاز به لایسنس داره).
در نهایت نسخه Flux 2 [klein] هم معرفی شده که یک مدل فشرده و کوچکتره و قراره به زودی تحت لایسنس کاملاً متنباز Apache 2.0 منتشر بشه تا با مدلهای همرده خودش رقابت کنه.
@aipulse24
مدل جدید Nano Banana Pro به گوگل اسلایدز هم رسیده و الان میتونید ازش بخواید تا اسلاید هاتون رو زیباتر کنه و حتی براتون اسلاید های جدید بسازه.
@aipulse24
همونطور که میدونید تصاویری که با جمنای تولید میشن دارای یک واترمارک نامرئی به نام SynthID هستن که تقریبا غیر قابل حذفه.
از امروز میتونید وقتی شک داشتید که عکسی واقعیه یا با هوش مصنوعی تولید شده، اون رو برای جمنای بفرستید و ازش بپرسید که آیا این عکس تولید شده توسط هوش مصنوعی هست یا خیر، جمنای این واترمارک رو تشخیص میده و نتیجه رو به شما اعلام میکنه.
@aipulse24
گوگل از Nano Banana Pro رونمایی کرده که بر مبنای جمنای ۳ پرو هست، تو این نسخه تکست رندرینگ به طرز چشمگیری بهبود پیدا کرده، موقع جنریت تصویر میتونه سرچ کنه و بر اساس اطلاعات معتبر موجود در اینترنت عکس رو جنریت کنه و ضمنا الان میتونه تصویر با خروجی 4K ارائه بده.
رندرینگ تکست فارسی هم نسبت به نسل قبل بهبود چشمگیری پیدا کرده.
@aipulse24
انتروپیک گفته در پروژهای به ارزش ۵۰ میلیارد دلار و با همکاری شرکت Fluidstack قراره دیتاسنترهای هوش مصنوعی اختصاصی خودش رو در نیویورک و تگزاس احداث کنه.
این دیتاسنترها که قراره تا سال ۲۰۲۶ عملیاتی بشن به طور مستقیم ۸۰۰ و به طور غیر مستقیم ۲۴۰۰ شغل ایجاد میکنن.
به گفته این شرکت انتروپیک حالا بیشتر از ۳۰۰ هزار مشتری سازمانی داره و تعداد سازمانهای بزرگی که از محصولات این شرکت استفاده میکنن نسبت به سال قبل ۷ برابر شده.
انتروپیک دلیل انتخاب Fluidstack به عنوان پیمانکار این پروژه رو توانایی بینظیر اونها در گسترش سریع زیرساختها برای رسیدن به مقیاس گیگاواتی در پردازش اعلام کرده.
@aipulse24
انتروپیک از نسخه جدید مدل هوش مصنوعی کوچک خودش با نام Claude Haiku 4.5 رونمایی کرده. این مدل طبق گفتهی شرکت، عملکردی مشابه با Sonnet 4 ارائه میده اما با یکسوم هزینه و بیش از دو برابر سرعت. به گفتهی انتروپیک، Haiku 4.5 در تستهای مختلف از جمله SWE-Bench و Terminal-Bench نتایج قابل توجهی گرفته و عملکردش در سطح مدلهایی مثل Sonnet 4، GPT-5 و Gemini 2.5 بوده. همچنین در زمینهی استفاده از ابزارها، تعامل با رایانه و استدلال بصری هم نتایج مشابهی ثبت کرده.
این مدل جدید بلافاصله در تمام پلنهای رایگان انتروپیک در دسترس قرار گرفته و به گفتهی شرکت، بهویژه برای نسخههای رایگان محصولات مبتنی بر هوش مصنوعی جذاب خواهد بود، چون میتونه با حداقل فشار بر سرورها، توانایی بالایی ارائه بده. ماهیت سبک بودن Haiku 4.5 باعث میشه بشه چندین عامل (agent) رو بهصورت همزمان اجرا کرد یا اونها رو در ترکیب با مدلهای قویتر مثل Sonnet به کار گرفت.
Haiku 4.5 تنها دو هفته بعد از عرضهی Sonnet 4.5 و دو ماه پس از Opus 4.1 منتشر شده و ادامهدهندهی روند سریع پیشرفت مدلهای انتروپیکه.
@aipulse24
شرکت انتروپیک در همکاری با مؤسسه امنیت هوش مصنوعی بریتانیا (UK AISI) و مؤسسه آلن تورینگ پژوهشی تازه منتشر کرده که یافتهاش حسابی جلب توجه کرده: فقط با حدود ۲۵۰ سند مخرب میشه یک مدل زبانی بزرگ رو آلوده و دچار "backdoor" کرد، اونم فارغ از اینکه اون مدل چهقدر بزرگ یا با چه حجمی از داده آموزش دیده باشه.
این مطالعه با عنوان “A small number of samples can poison LLMs of any size” در تاریخ ۹ اکتبر ۲۰۲۵ منتشر شده و نشون میده برخلاف تصور قبلی، برای حملات data poisoning نیازی نیست مهاجم درصد زیادی از دادههای آموزشی رو در اختیار داشته باشه؛ بلکه فقط یک تعداد ثابت، هرچند کم، میتونه کافی باشه.
پژوهشگران برای آزمایش، از نوعی حمله ساده و کمخطر استفاده کردن که باعث میشه مدل وقتی عبارت خاصی مثل <SUDO> رو ببینه، بهجای پاسخ طبیعی، متنی نامفهوم و بیمعنی تولید کنه.
در این پروژه، مدلهایی با اندازههای مختلف از ۶۰۰ میلیون تا ۱۳ میلیارد پارامتر آموزش داده شدن و نتایج نشون داد که میزان موفقیت حمله در همهی این مدلها تقریباً یکسانه. یعنی حتی وقتی مدل بزرگتر روی دادههای خیلی بیشتری آموزش دیده، باز هم همون تعداد محدود از اسناد آلوده برای فریبش کافیه.
طبق گزارش، ۱۰۰ سند سمی برای آلوده کردن مدل کافی نبود، ولی با ۲۵۰ سند یا بیشتر، تمام مدلها در مقیاسهای مختلف به طور پایدار دچار رفتار مخرب شدن. نکته جالب اینجاست که موفقیت حمله به تعداد مطلق این اسناد بستگی داره، نه نسبت اونها به حجم کلی دادهی آموزشی. به زبان ساده، مهم نیست کل دیتاست چقدر بزرگ باشه؛ وقتی مدل چند صد سند آلوده رو ببینه، یاد میگیره که به اون الگوی خاص واکنش اشتباه نشون بده.
این تحقیق که بزرگترین مطالعهی منتشرشده در زمینهی آلودگی داده در مدلهای زبانی بهشمار میره، نگرانیهایی رو دربارهی امنیت مدلهای هوش مصنوعی مطرح کرده. تیم انتروپیک در پایان تأکید کرده که هدف از انتشار این نتایج، هشدار به جامعهی پژوهشی و تشویق به توسعهی روشهای دفاعی بهتره، نه فراهم کردن ابزار برای مهاجمان.
به گفتهی اونها، آگاهی از این آسیبپذیریها کمک میکنه تا از تکرارش در مدلهای بزرگتر و حساستر جلوگیری بشه و مسیر ایمنتری برای گسترش هوش مصنوعی ترسیم بشه.
@aipulse24
اوپن ایآی همچنین از اپلیکیشن Sora برای iOS رونمایی کرده که به این وسیله کاربران میتونن ویدیوهایی که با Sora ویرایش کردن یا ساختن رو با دیگران به اشتراک بذارن.
این اپلیکیشن فعلا فقط با دعوت دیگر کاربران در دسترسه اما گفته شده که به زودی کاربران بیشتری میتونن از اون استفاده کنند.
کاربران اندروید هم میتونن از طریق sora.com به این سرویس دسترسی داشته باشن مشروط به اینکه کد دعوت از شخصی که قبلا به اون دسترسی داده شده داشته باشن.
این شرکت همچنین اعلام کرده به زودی مدل جدید Sora 2 از طریق API هم در دسترس خواهد بود.
@aipulse24
شرکت انتروپیک تازهترین مدل خودش به اسم Claude Sonnet 4.5 رو معرفی کرده؛ مدلی که به گفته شرکت بهترین مدل دنیا برای کدنویسی و ساخت ایجنتهای پیچیده محسوب میشه. این نسخه نهتنها توانایی استفاده از کامپیوتر و حل مسائل سخت ریاضی و منطقی رو بهطور چشمگیری بهتر کرده، بلکه نسبت به نسلهای قبلی پیشرفت محسوسی در تمرکز روی کارهای طولانیمدت داشته و توی آزمونهایی مثل SWE-bench Verified و OSWorld رکورد جدیدی ثبت کرده. قیمت استفاده از مدل هم مثل نسخه ۴ ثابت مونده و تغییری نکرده.
همزمان با معرفی Sonnet 4.5، مجموعهای از قابلیتهای تازه هم به محصولات کلاد اضافه شده؛ مثل چکپوینتها در Claude Code که امکان بازگشت به مراحل قبلی رو فراهم میکنن، افزونه بومی برای VS Code، و یک ابزار جدید برای مدیریت حافظه و کانتکست در API. در اپلیکیشنهای کلاد هم قابلیت اجرای کد و ایجاد مستقیم فایلهای مختلف (از جمله اسناد، اسلاید و جدول) اضافه شده. علاوه بر این، افزونه مرورگر Claude for Chrome برای کاربران پلن Max در دسترس قرار گرفته.
انتروپیک همچنین زیرساخت اختصاصی خودش برای ساخت ایجنتها رو با نام Claude Agent SDK منتشر کرده؛ همون زیرساختی که پشت Claude Code قرار داره. این ابزار به توسعهدهندهها اجازه میده ایجنتهای قدرتمند و قابل سفارشیسازی بسازن و مسائل دشوار مثل مدیریت حافظه در کارهای طولانی یا هماهنگی بین زیرایجنتها رو حل کنن. به گفته انتروپیک، این SDK فقط برای کدنویسی نیست و میتونه توی حوزههای دیگه هم استفاده بشه.
از نظر ایمنی هم Sonnet 4.5 پیشرفت زیادی کرده. این مدل با سطح حفاظتی AI Safety Level 3 عرضه شده و فیلترهای خاصی برای جلوگیری از سوءاستفادههای خطرناک (مثل موضوعات CBRN) داره. انتروپیک میگه رفتارهای نگرانکننده مثل تملقگویی، فریب یا پیروی از پرامپتهای مضر نسبت به نسلهای قبل بهشدت کاهش پیدا کرده.
@aipulse24
شرکتهای OpenAI و گوگل اعلام کردن که مدلهای استدلالیشون تونستن توی مسابقات جهانی ICPC، معتبرترین رقابت برنامهنویسی دانشگاهی دنیا، به سطح مدال طلا برسن.
توی این رقابت که ۴ سپتامبر برگزار شد، ۱۳۹ تیم از بین حدود سههزار دانشگاه شرکت کردن و پنج ساعت وقت داشتن تا ۱۲ مسئله پیچیده رو حل کنن. مدلهای اوپنایآی همه مسائل رو درست جواب دادن و عملاً اول شدن، در حالی که الگوریتم گوگل ۱۰ مسئله رو حل کرد و در جایگاه دوم قرار گرفت.
نکته جالب این بود که هر دو مدل تونستن «مسئله C» رو جواب بدن؛ مسئلهای که هیچ تیم انسانی از پسش برنیومده بود.
گوگل با نسخه پیشرفته مدل Gemini 2.5 Pro Deep Think وارد مسابقه شد و اوپنایآی هم با GPT-5 و یک مدل آزمایشی تازه شرکت کرد که هنوز عمومی نشده. GPT-5 با کمک اون مدل ۱۱ مسئله رو حل کرد و مسئله آخر رو مدل آزمایشی بهتنهایی جواب داد.
@aipulse24
شرکت krea.ai در پستی که در شبکه اجتماعی ایکس منتشر کرده از اولین مدل تولید ویدیوی realtime رونمایی کرده، با استفاده از این مدل میتونید به صورت زنده حالات ویدیوی تولید شده رو تغییر بدید.
این مدل فعلا در مرحله بتا قرار داره و تایم دقیقی هم برای عرضه عمومی اون مشخص نشده.
@aipulse24
شرکت گوگل در مطالعهای جدید ادعا کرده که هوش مصنوعی جمنای تأثیر محیط زیستی بسیار کمی داره و هر درخواست متنی معمولی از اون فقط به اندازه پنج قطره آب مصرف میکنه. طبق این گزارش، هر پرامپت حدود ۰.۲۶ میلیلیتر آب و ۰.۲۴ وات-ساعت برق مصرف میکنه که معادل تماشای تلویزیون برای کمتر از نه ثانیهاس. گوگل میگه این آمار پایین به خاطر بهینهسازیهایی بوده که در یک سال گذشته انجام داده، اما کارشناسان معتقدند این ادعاها گمراهکنندهاس چون گوگل دادههای کلیدی رو از گزارش خودش حذف کرده.
انتقاد اصلی متخصصان اینه که گوگل «مصرف غیرمستقیم آب» رو در محاسباتش نیاورده. آماری که گوگل ارائه داده فقط مربوط به آبیه که مستقیماً در سیستمهای خنککننده دیتاسنترها برای جلوگیری از داغ شدن سرورها استفاده میشه. اما بخش عمده آب مصرفی یک دیتاسنتر در واقع مربوط به نیروگاههای برق (گازی یا هستهای) میشه که برق مورد نیاز همون دیتاسنتر رو تولید میکنن. به گفته کارشناسان، با حذف این بخش، گوگل در واقع فقط «نوک کوه یخ» رو به ما نشون میده و اطلاعات مهم رو پنهان میکنه.
اشکال دیگری که به این گزارش وارده، نحوه مقایسه دادههاست. گوگل برای اینکه آمار خودش رو بهتر جلوه بده، مصرف آب «مستقیم» خودش رو با تحقیقات قبلی مقایسه کرده که در اونها مصرف آب «کل» (مستقیم و غیرمستقیم) محاسبه شده بود. علاوه بر این، گوگل از معیار «میانه» (median) برای هر پرامپت استفاده کرده تا تأثیر درخواستهای بسیار سنگین و پرمصرف، میانگین رو بالا نبره. کارشناسان میگن این روش مقایسه درست نیست و تصویر دقیقی از واقعیت ارائه نمیده.
اما شاید مهمترین نکته، تصویر کلی ماجرا باشه. حتی اگه ادعای گوگل مبنی بر بهینهتر شدن هر درخواست هوش مصنوعی درست باشه، رشد انفجاری و استفاده گسترده از این فناوری باعث شده که مصرف کل منابع و آلودگی کلی شرکت به شدت افزایش پیدا کنه. این پدیده به «پارادوکس جونز» معروفه. گزارش پایداری خود گوگل نشون میده که انتشار کربن این شرکت در سال گذشته ۱۱ درصد بیشتر شده. به همین خاطر، کارشناسان میگن با وجود آمارهای جزئی و به ظاهر مثبت، داستان کامل بسیار نگرانکنندهتره.
@aipulse24
گوگل عضو جدیدی به نام Gemma 3 270M به خانواده مدلهای جما اضافه کرده. مدلی جمعوجور با ۲۷۰ میلیون پارامتر که برای وظایف مشخص و سبک طراحی شده. این مدل با وجود اندازه کوچک، توانایی بالایی در دنبال کردن دستورالعملها و ساختاربندی متن داره و همین باعث شده به گزینهای مناسب برای استفاده روی دستگاههایی با منابع محدود تبدیل بشه.
یکی از ویژگیهای مهم Gemma 3 270M مصرف انرژی فوقالعاده کمشه. طبق آزمایشها روی گوشی Pixel 9 Pro، نسخه INT4 این مدل برای ۲۵ مکالمه فقط حدود ۰.۷۵ درصد از باتری استفاده کرده. علاوه بر این، به صورت آماده برای کوانتایزیشن منتشر شده تا بشه اون رو روی سختافزارهای حتی محدودتر هم با کمترین افت کارایی اجرا کرد.
کاربرد اصلی این مدل در کارهای مشخص مثل تحلیل احساسات، استخراج داده، تبدیل متن Unstructured به متن ساختاریافته و حتی تولید محتوای خلاقانهست. به خاطر اندازه کوچک، توسعهدهندهها میتونن خیلی سریع اون رو برای نیازهای خاص خودشون فاینتیون کنن و بدون نیاز به زیرساختهای سنگین، مدلهای تخصصی و کمهزینه بسازن.
این مدل از طریق Hugging Face، Ollama، Kaggle و سایر پلتفرمها در دسترس توسعهدهندهها قرار گرفته.
@aipulse24
شرکت انتروپیک قابلیت «حافظه» رو به چتبات خودش، Claude، اضافه کرده تا کاربران بتونن راحتتر مکالمات و پروژههاشون رو از جایی که قبلاً رها کرده بودن ادامه بدن. این قابلیت باعث میشه Claude بتونه به چتهای قبلی کاربر (وقتی که ازش خواسته میشه) رجوع کنه، بنابراین دیگه لازم نیست کاربر دوباره همه چیز رو توضیح بده.
در ویدئوی دموی منتشرشده توسط انتروپیک، کاربری از Claude پرسید قبل از تعطیلات روی چه کاری مشغول بوده و Claude با جستجو در مکالمات قدیمی، فهرست موضوعات، خلاصه کارها و پیشنهاد ادامه پروژه رو ارائه داد. این قابلیت فعلاً برای مشترکان نسخههای Max، Team و Enterprise روی وب، دسکتاپ و موبایل فعال میشه و امکان جدا نگهداشتن پروژهها و فضاهای کاری مختلف رو هم داره.
انتروپیک اعلام کرده که با این ویژگی «دیگه هیچوقت روند کارتون رو گم نمیکنید» و میتونید بدون شروع از صفر، پروژهها رو ادامه بدید یا به بحثهای قبلی رجوع کنید. برای فعالکردنش باید به بخش Settings، قسمت Profile برید و گزینه جستجو و ارجاع به چتها رو روشن کنید.
البته انتروپیک تأکید کرده که این قابلیت با شبیه به چیزی که در حافظه ChatGPT میبینیم فرق داره و Claude بهطور خودکار همه گفتهها رو ذخیره یا پروفایل شخصی کاربر رو ایجاد نمیکنه؛ بلکه فقط وقتی کاربر بخواد، به مکالمات قبلی مراجعه میکنه.
@aipulse24