তিনটি নতুন ইউএসই বহুভাষিক মডিউল টেনসরফ্লোতে আসছে

প্রযুক্তি / তিনটি নতুন ইউএসই বহুভাষিক মডিউল টেনসরফ্লোতে আসছে 2 মিনিট পড়া

গুগল ভয়েস অনুসন্ধান



গুগল এআই গবেষণার অন্যতম পথিকৃৎ এবং তাদের প্রকল্পের অনেক লোক মাথা ঘুরে দেখেছে। আলফাজিরো গুগল থেকে ডিপমাইন্ড টিমটি এআই গবেষণায় একটি যুগান্তকারী ছিল, প্রোগ্রামটির নিজের দ্বারা জটিল গেমগুলি শেখার দক্ষতার কারণে (হিউম্যান ট্রেনিং এবং হস্তক্ষেপ ছাড়াই)। গুগলও এতে দুর্দান্ত কাজ করেছে প্রাকৃতিক ভাষা প্রক্রিয়াকরণ প্রোগ্রাম (এনএলপি), যা মানুষের বক্তব্য বোঝার এবং প্রক্রিয়াজাতকরণে গুগল সহকারীটির দক্ষতার পিছনে অন্যতম কারণ is

গুগল সম্প্রতি তিনটি নতুন প্রকাশের ঘোষণা দিয়েছে বহুভাষিক মডিউল ব্যবহার করুন এবং শব্দার্থভাবে অনুরূপ পাঠ্য পুনরুদ্ধারের জন্য আরও বহুভাষিক মডেল সরবরাহ করে।



প্রথম দুটি মডিউলগুলি শব্দার্থগতভাবে অনুরূপ পাঠ্য পুনরুদ্ধারের জন্য বহুভাষিক মডেল সরবরাহ করে, একটি পুনরুদ্ধার কার্যকারিতার জন্য অনুকূলিতকরণ এবং অন্যটি গতি এবং কম স্মৃতি ব্যবহারের জন্য। তৃতীয় মডেল জন্য বিশেষায়িত হয় প্রশ্ন উত্তর পুনরুদ্ধার ষোলটি ভাষায় (ইউএসই-কিউএ) এবং ইউএসই এর সম্পূর্ণ নতুন প্রয়োগ উপস্থাপন করে। তিনটি বহুভাষিক মডিউল একটি ব্যবহার করে প্রশিক্ষিত হয় মাল্টি-টাস্ক ডুয়েল-এনকোডার ফ্রেমওয়ার্ক ইংরেজির জন্য মূল ইউএসই মডেলের অনুরূপ, প্রযুক্তিটি উন্নত করার জন্য আমরা যে প্রযুক্তিগুলি ব্যবহার করেছি সেগুলি ব্যবহার করার সময় অ্যাডিটিভ মার্জিন সফটম্যাক্স পদ্ধতির সাথে ডুয়াল-এনকোডার । এগুলি কেবলমাত্র ভাল ট্রান্সফার লার্নিং পারফরম্যান্স বজায় রাখার জন্যই নয়, বরং সি এনমেটিক পুনরুদ্ধার কার্য সম্পাদন করার জন্য ডিজাইন করা হয়েছে।



সিস্টেমে ল্যাঙ্গুয়েজ প্রসেসিং অনেক দীর্ঘ এগিয়েছে বেসিক সিনট্যাক্স ট্রি পার্সিং থেকে বড় ভেক্টর অ্যাসোসিয়েশন মডেলগুলিতে। পাঠ্য প্রসঙ্গে প্রসঙ্গটি বোঝা এনএলপি ক্ষেত্রের অন্যতম বৃহত্তম সমস্যা এবং ইউনিভার্সাল সেনটেশন এনকোডার উচ্চ মাত্রিক ভেক্টরগুলিতে পাঠ্য রূপান্তর করে এটি সমাধান করে, যা পাঠ্য র‌্যাঙ্কিং এবং বর্ণনাকে সহজ করে তোলে।



ইউটিই চিহ্নিতকরণ কাঠামোর উত্স - গুগল ব্লগ

গুগলের মতে, তিনটি নতুন মডিউলগুলি সমস্ত শব্দার্থক পুনরুদ্ধার আর্কিটেকচারে নির্মিত, যা সাধারণত প্রশ্ন এবং উত্তরগুলির এনকোডিংকে পৃথক নিউরাল নেটওয়ার্কগুলিতে বিভক্ত করে, যা মিলিসেকেন্ডের মধ্যে কয়েক বিলিয়ন সম্ভাব্য উত্তরগুলির মধ্যে অনুসন্ধান করা সম্ভব করে। ”অন্য কথায়, এটি ডেটার আরও ভাল ইনডেক্সিংয়ে সহায়তা করে।

' তিনটি বহুভাষিক মডিউল একটি ব্যবহার করে প্রশিক্ষিত হয় মাল্টি-টাস্ক ডুয়েল-এনকোডার ফ্রেমওয়ার্ক ইংরেজির জন্য মূল ইউএসই মডেলের অনুরূপ, প্রযুক্তিটি উন্নত করার জন্য আমরা যে প্রযুক্তিগুলি ব্যবহার করেছি সেগুলি ব্যবহার করার সময় অ্যাডিটিভ মার্জিন সফটম্যাক্স পদ্ধতির সাথে ডুয়াল-এনকোডার । এগুলি কেবলমাত্র ভাল ট্রান্সফার লার্নিং পারফরম্যান্স বজায় রাখার জন্যই তৈরি করা হয়নি, তবে সি এনমেটিক পুনরুদ্ধারের কাজগুলি ভালভাবে সম্পাদন করার জন্য ” সফটম্যাক্স ফাংশন প্রায়শই ভেক্টরকে ঘনিষ্ট করে এবং তারপরে প্রতিটি উপাদানকে তাত্পর্য যোগফলের যোগ করে গুণনীয় শক্তি বাঁচাতে ব্যবহৃত হয়।



শব্দার্থ পুনরুদ্ধার স্থাপত্য

“তিনটি নতুন মডিউলগুলি শব্দার্থক পুনরুদ্ধার আর্কিটেকচারে নির্মিত, যা সাধারণত প্রশ্ন এবং উত্তরগুলির এনকোডিংকে পৃথক নিউরাল নেটওয়ার্কগুলিতে বিভক্ত করে, যা মিলিসেকেন্ডের মধ্যে কয়েক বিলিয়ন সম্ভাব্য উত্তরগুলির মধ্যে অনুসন্ধান করা সম্ভব করে। দক্ষ শব্দার্থক পুনরুদ্ধারের জন্য দ্বৈত এনকোডার ব্যবহার করার মূল চাবিকাঠিটি প্রত্যাশিত ইনপুট প্রশ্নের সকল প্রার্থীর উত্তর প্রাক-এনকোড করা এবং সেগুলি সমাধানের জন্য অনুকূলিত করা একটি ভেক্টর ডাটাবেসে সংরক্ষণ করা নিকটতম প্রতিবেশী সমস্যা , যা প্রচুর প্রার্থীদের ভাল দিয়ে দ্রুত অনুসন্ধান করার অনুমতি দেয় নির্ভুলতা এবং স্মরণ '

আপনি টেনসরফ্লো হাব থেকে এই মডিউলগুলি ডাউনলোড করতে পারেন। আরও পড়ার জন্য গুগলএআইএর পূর্ণ দেখুন ব্লগ পোস্ট ।

ট্যাগ গুগল