কৃত্রিম বুদ্ধিমত্তার ক্ষেত্রে এগিয়ে যাওয়ার জন্য, Google তার সর্বশেষ এআই মডেল জেমিনিকে চালু করেছে। এই উদ্ভাবনী মডেল, প্রথাগত মডেলের বিপরীতে, শুরু থেকেই ভিন্নধর্মী ডেটা ফর্ম্যাট-টেক্সট, কোড, অডিও, ইমেজ এবং ভিডিও ব্যাখ্যা করতে সক্ষম।
সাধারণত, মাল্টিমোডাল মডেলগুলি বিভিন্ন তথ্য বিন্যাসের জন্য আলাদাভাবে বিভিন্ন উপাদানকে প্রশিক্ষণ দিয়ে এবং তারপরে সেগুলিকে একীভূত করে তৈরি করা হয়। যাইহোক, এই আদর্শ অনুশীলন থেকে প্রস্থান করে, মিথুন একটি ভিন্ন পদ্ধতির ব্যবহার করে। মডেলটি গেট-গো থেকে বিভিন্ন ডেটা ফরম্যাটে প্রশিক্ষিত এবং অতিরিক্ত মাল্টিমোডাল ডেটার সাথে সূক্ষ্ম-টিউনড। এই পদ্ধতিটি বর্তমান মাল্টিমোডাল মডেলকে ছাড়িয়ে গিয়ে একাধিক ডেটা প্রকার জুড়ে জেমিনিকে বুঝতে এবং যুক্তি দিতে সহায়তা করে। Gemini-এর শক্তির কথা তুলে ধরে, Google এবং Alphabet-এর CEO Sundar Pichai এবং Google DeepMind-এর CEO এবং সহ-প্রতিষ্ঠাতা Demis Hassabis শেয়ার করেছেন যে মডেলের ক্ষমতাগুলি প্রায় প্রতিটি ডোমেনে সেরার সমান৷
লক্ষণীয়ভাবে, মিথুনের শক্তিশালী যুক্তির ক্ষমতা রয়েছে, এটি জটিল লিখিত এবং চাক্ষুষ তথ্য উপলব্ধি করতে সক্ষম করে। এটি ডেটার বিশাল পুল থেকে কঠিন-খুঁজে পাওয়া জ্ঞান আহরণে পারদর্শী, এর জন্য ধন্যবাদ। এটির একটি একাকী উদাহরণ হল মূল্যবান অন্তর্দৃষ্টির জন্য কয়েক হাজার নথির মাধ্যমে পরীক্ষা করার ক্ষমতা যা অনেক ক্ষেত্রে সাফল্যের দিকে পরিচালিত করে। অধিকন্তু, মিথুনের মাল্টিমোডাল দিকগুলি গণিত এবং পদার্থবিদ্যার মতো বিষয়গুলিতে জটিল প্রশ্নগুলির পাঠোদ্ধারে এটিকে বিশেষভাবে কার্যকর করে তোলে।
প্রাথমিক জেমিনি 1.0 তিনটি ভেরিয়েন্টে পাওয়া যায়—আল্ট্রা, প্রো এবং ন্যানো, প্রতিটি বিভিন্ন আকারের প্রয়োজনীয়তা পূরণ করে। Google মতে, জেমিনি আল্ট্রা প্রাথমিক বেঞ্চমার্কিং চলাকালীন মডেল ডেভেলপমেন্ট এবং গবেষণায় 32টি সাধারণভাবে ব্যবহৃত একাডেমিক বেঞ্চমার্কের মধ্যে 30 টিকে ছাড়িয়ে গেছে। উল্লেখযোগ্যভাবে, জেমিনি আল্ট্রাও মানব বিশেষজ্ঞদের ছাড়িয়ে যাওয়া প্রথম মডেল। এটি গণিত এবং পদার্থবিদ্যা থেকে ইতিহাস, আইন, চিকিৎসা এবং নীতিশাস্ত্র পর্যন্ত 57 টি শাখাকে অন্তর্ভুক্ত করে ব্যাপক মাল্টিটাস্ক ভাষা বোঝার (MMLU) ব্যবহার করে পরিমাপ করা হয়েছিল।
জেমিনি প্রো এখন বার্ডের সাথে একীভূত হয়েছে, এটি প্রকাশের পর থেকে সবচেয়ে উল্লেখযোগ্য বার্ড আপডেটের প্রতিনিধিত্ব করে। এটা লক্ষণীয় যে Pixel 8 Pro কে Gemini Nano-এর ক্ষমতাগুলিকে কাজে লাগানোর জন্য অপ্টিমাইজ করা হয়েছে যেমন রেকর্ডার অ্যাপে সারমাইজ করা এবং Google এর কীবোর্ডে স্মার্ট রিপ্লাই।
আগামী মাসগুলিতে, জেমিনি আরও Google পণ্য যেমন অনুসন্ধান, বিজ্ঞাপন, ক্রোম এবং ডুয়েট AI-তে অন্তর্ভুক্ত হবে বলে আশা করা হচ্ছে৷ 13 ডিসেম্বর থেকে, ডেভেলপারদের Google AI স্টুডিও বা Google Cloud Vortex AI-তে Gemini API-এর মাধ্যমে Gemini Pro-তে অ্যাক্সেস দেওয়া হবে।
এটি ছাড়াও, জেমিনি পাইথন, জাভা, সি++ এবং গো সহ বেশ কয়েকটি প্রচলিত প্রোগ্রামিং ভাষা বুঝতে পারে। পিচাই এবং হাসাবিসের মতে, মিথুনের শব্দ ভাষার দক্ষতা এবং জটিল তথ্য সম্পর্কে যুক্তির ক্ষমতা এটিকে বিশ্বব্যাপী কোডিংয়ের জন্য একটি শীর্ষ-স্তরের ভিত্তি মডেল করে তোলে।
Google AlphaCode 2 নামে পরিচিত একটি উন্নত কোড-জেনারেশন সিস্টেম ডিজাইন করতে জেমিনিকে নিযুক্ত করেছে। এই সিস্টেমটি, দুই বছর আগে প্রকাশিত প্রথম সংস্করণের একটি আপগ্রেড, জটিল গণিত এবং তাত্ত্বিক কম্পিউটার বিজ্ঞানের সাথে জড়িত প্রতিযোগিতামূলক প্রোগ্রামিং সমস্যাগুলি মোকাবেলা করতে পারে।
অত্যাধুনিক এআই মডেলের প্রশিক্ষণের জন্য ডিজাইন করা ক্লাউড TPU v5p নামে একটি নতুন টিপিইউ সিস্টেম উন্মোচন করে, জেমিনির লঞ্চকে আরও পরিপূরক করে। এই পরবর্তী-প্রজন্মের TPU জেমিনির বিকাশকে ত্বরান্বিত করবে এবং ডেভেলপার এবং এন্টারপ্রাইজ ক্লায়েন্টদেরকে বৃহৎ আকারের জেনারেটিভ এআই মডেলের প্রশিক্ষণে সাহায্য করবে। এটি নিশ্চিত করবে যে নতুন পরিষেবা এবং ক্ষমতাগুলি স্বল্প সময়ের মধ্যে গ্রাহকদের কাছে পৌঁছাবে৷
মিথুনের বিকাশের সময় Google দায়িত্বশীল AI নীতিগুলি মেনে চলার উপর জোর দিয়েছে। এটি সাইবার-অপরাধ, প্ররোচনা এবং স্বায়ত্তশাসনের মতো সম্ভাব্য ঝুঁকিপূর্ণ ক্ষেত্রগুলিতে গবেষণা চালিয়েছে। সহিংসতা বা নেতিবাচক স্টেরিওটাইপ ধারণকারী সামগ্রী চিহ্নিত করতে, লেবেল করতে এবং আলাদা করার জন্য নিরাপত্তা শ্রেণীবদ্ধকরণগুলিও তৈরি করা হয়েছিল৷
জেমিনীর লঞ্চ AI এর বিবর্তনের একটি গুরুত্বপূর্ণ মাইলফলককে নির্দেশ করে এবং Google এ একটি নতুন যুগের সূচনা করে৷ ভবিষ্যত সংস্করণে জেমিনীর কার্যকারিতা প্রসারিত করার প্রচেষ্টার সাথে, পরিকল্পনায় উন্নতি এবং মেমরির অগ্রগতি, এবং আরও তথ্য প্রক্রিয়াকরণের জন্য প্রসঙ্গ উইন্ডো বৃদ্ধি করে, ভবিষ্যতে আরও ভাল প্রতিক্রিয়ার প্রতিশ্রুতি দেয়।
no-code এবং low-code রাজ্যের দিগন্ত বিস্তৃত হওয়ার সাথে সাথে, অ্যাপমাস্টারের মতো প্ল্যাটফর্মগুলি ডেভেলপার এবং ব্যবসায়িক পেশাদারদেরকে জেমিনির মতো এআই অগ্রগতির পরিপূরক করার জন্য স্কেলযোগ্য এবং শক্তিশালী অ্যাপ্লিকেশন তৈরি করতে সক্ষম করে। বৈশিষ্ট্যগুলির একটি চিত্তাকর্ষক তালিকার মাধ্যমে, AppMaster দ্রুত বিকশিত অ্যাপ বিকাশের ল্যান্ডস্কেপে একটি বহুমুখী এবং সাশ্রয়ী সমাধান হিসাবে দাঁড়িয়েছে।