Back home

AI দক্ষতার উন্নতি টিম ডেলিভারি বেসলাইন উন্নত করতে থাকবে

যখন মৌলিক আউটপুট অটোমেশন দ্বারা গ্রাস করা হয়, তখন যা সত্যিই দুর্লভ তা হ'ল জটিল সমস্যাগুলিতে স্থিরভাবে একত্রিত হওয়ার ক্ষমতা।

সর্বশেষ সংস্করণ চক্রে, ডেলিভারি গতি হঠাৎ খুব টাইট হয়ে ওঠে। এটা এমন নয় যে চাহিদা আকাশচুম্বী হয়েছে বা জনবল কমেছে, কিন্তু দুটি জিনিস ওভারল্যাপ হয়েছে: কোড জেনারেশন এবং ডকুমেন্ট জেনারেশন দ্রুত হয়েছে, কিন্তু রিভিউ এবং জয়েন্ট ডিবাগিং একই সময়ে দ্রুত হয়ে ওঠেনি। ফলাফল হল যে প্রাথমিক কাজগুলি প্রথমার্ধে সংকুচিত হয়, জটিল সমস্যাগুলি দ্বিতীয়ার্ধে কেন্দ্রীভূত হয় এবং রিলিজ উইন্ডোটি নিয়ন্ত্রণের বাইরে চলে যাওয়ার সম্ভাবনা বেশি হয়।

এই পরিবর্তনটিকে “দক্ষতা উন্নতির পরে স্বাভাবিক ব্যথা” হিসাবে খুব সহজেই ভুল ধারণা করা হয়। আসল সমস্যাটি আরও সুনির্দিষ্ট: দলের ডিফল্ট ক্ষমতা বেসলাইনটি আবার লেখা হয়েছে, কিন্তু টাস্ক স্প্লিটিং, কোয়ালিটি থ্রেশহোল্ড এবং দায়িত্ব অ্যাসাইনমেন্টগুলি এখনও পুরানো সংস্করণে রয়েছে।

মৌলিক কাজগুলি ত্বরান্বিত হওয়ার পরে, সারিবদ্ধ পয়েন্টটি সিদ্ধান্ত গ্রহণের প্রক্রিয়াতে স্থানান্তরিত হবে।

এআই জড়িত হওয়ার পরে, নমুনা কোড, ইন্টারফেস এনক্যাপসুলেশন, পরীক্ষার খসড়া এবং সাপ্তাহিক প্রতিবেদনের প্রথম খসড়াগুলি দ্রুত তৈরি করা যেতে পারে। বোর্ডে “প্রগতিতে” কার্ডগুলি দ্রুত নেমে গেছে এবং প্রথম কয়েক দিনের জন্য স্বস্তির অনুভূতি ছিল। কিন্তু যৌথ ডিবাগিং পর্যায়ে, বাধাগুলি তিন ধরনের বিচারের উপর ফোকাস করবে:

  • একাধিক রাউন্ড পরিবর্তনের পরেও কি চাহিদার সীমানা এখনও সামঞ্জস্যপূর্ণ?
  • জেনারেট করা কোডের অন্তর্নিহিত অনুমান বিদ্যমান নেটওয়ার্কের সীমাবদ্ধতার সাথে বিরোধপূর্ণ কিনা
  • যখন একাধিক মডিউল একই সময়ে পরিবর্তন করা হয়, তখন চূড়ান্ত আচরণের জন্য কে দায়ী?

ক্রমাগত গতিতে এই তিন ধরনের সমস্যার সমাধান করা যাবে না। তাদের ক্রস-রোল ঐক্যমত্য প্রয়োজন, তাদের প্রাসঙ্গিক ধারাবাহিকতা প্রয়োজন, এবং ব্যর্থতার খরচ সম্পর্কে তাদের একীভূত বোঝার প্রয়োজন। এই কারণে, প্রথমার্ধে সংরক্ষিত সময় প্রায়শই দ্বিতীয়ার্ধে একটি রোলব্যাক বা দুই রাউন্ড পুনর্ব্যবহার দ্বারা খাওয়া হয়।

ডেলিভারির চাপ বাড়ানোর পরে, ব্যর্থ হওয়ার প্রথম জিনিসটি হল পুরানো সমাপ্তির সংজ্ঞা।

অতীতে, সম্পন্নের সংজ্ঞাটি সাধারণত ছিল “ফাংশন উপলব্ধ + পরীক্ষা পাস + ডকুমেন্টেশন সম্পন্ন”। AI ত্বরান্বিত হওয়ার সাথে সাথে এই সংজ্ঞাটি খুব আলগা হয়ে যাবে। একটি প্রতিশ্রুতি যা সম্পূর্ণ দেখায় মূল প্রশ্নের উত্তর না দিয়ে শুধু “চালাতে” পারে:

  • ব্যর্থতার পথটি পর্যবেক্ষণযোগ্য কিনা
  • গ্রেস্কেলের সময় ব্যতিক্রমগুলি রোল ব্যাক করা যেতে পারে কিনা
  • পরবর্তী পরিবর্তনের সময় স্বয়ংক্রিয়ভাবে তৈরি হওয়া অংশটি বজায় রাখা যাবে কিনা

যদি সম্পন্নের সংজ্ঞাটি আপগ্রেড না করা হয়, তবে দলটির গতির একটি বিভ্রম থাকবে: একটি উচ্চতর আপাত সমাপ্তির হার এবং একটি নিম্ন সত্য প্রকাশযোগ্য হার। এই পর্যায়ে সবচেয়ে সাধারণ ঘটনা হল যে স্ট্যান্ডআপ ডেটা খুব ভাল, কিন্তু রিলিজ রাতে অনেক সমস্যা আছে।

রিভিউ মেকানিজমকে কোড রিভিউ থেকে হাইপোথিসিস রিভিউ পর্যন্ত প্রসারিত করতে হবে

বিশুদ্ধ কোড পর্যালোচনা এই পর্যায়ে যথেষ্ট নয়। জেনারেটেড কোড প্রায়ই ব্যাকরণগতভাবে সঠিক এবং কাঠামোগতভাবে সম্পূর্ণ, এবং সমস্যাগুলি প্রায়ই অনুমানের মধ্যে লুকিয়ে থাকে। উদাহরণস্বরূপ, ডিফল্ট পুনরায় চেষ্টা করার কৌশল, ডিফল্ট টাইমআউট এবং ডিফল্ট ডাউনগ্রেড পাথ সবই যুক্তিসঙ্গত বলে মনে হয়, কিন্তু যখন বর্তমান সিস্টেমে রাখা হয়, তখন তারা দুর্বল পয়েন্টে আঘাত করতে পারে।

একটি কার্যকর পর্যালোচনাকে স্পষ্টভাবে বলা দরকার “এই পরিবর্তনটি কীসের উপর নির্ভর করে।” ভিত্তি যত পরিষ্কার হবে, পরবর্তী জয়েন্ট ডিবাগিং তত বেশি স্থিতিশীল হবে। প্রকৃত বাস্তবায়নে, তিন ধরনের তথ্য রেকর্ড করা উল্লেখযোগ্যভাবে পুনরায় কাজ কমাতে পারে:

  1. মূল অনুমান (এটি কোন বাহ্যিক অবস্থার উপর নির্ভর করে)
  2. ব্যর্থতার সংকেত (কোন ঘটনাটি নির্দেশ করে যে অনুমানটি ভেঙে গেছে)
  3. রোলব্যাক অ্যাকশন (কে সংকেত পরিচালনা করবে এবং কতক্ষণ পরে এটি ঘটবে)

এটি প্রক্রিয়াটির উপর বোঝা বাড়ানোর জন্য নয়, তবে চ্যাট রেকর্ডগুলিতে লুকানো অন্তর্নিহিত রায়গুলিকে সুস্পষ্ট সীমাবদ্ধতায় পরিণত করার জন্য যা আগে থেকে সহযোগিতা করা যেতে পারে।

এআই দক্ষতার উন্নতি স্বয়ংক্রিয়ভাবে চাপ কমাবে না, এটি চাপ বিতরণকে পুনর্বিন্যাস করবে

ইঞ্জিনিয়ারিং ফলাফল থেকে বিচার করে, চাপ অদৃশ্য হয়ে যায়নি, তবে “আউটপুট গতি” থেকে “কনভারজেন্স কোয়ালিটিতে” স্থানান্তরিত হয়েছে। যে কেউ ভুল অনুমানগুলি দ্রুত আবিষ্কার করতে পারে, ক্রস-মডিউল পার্থক্যগুলিকে একত্রিত করতে পারে এবং ব্যর্থতার পথগুলিকে স্থিতিশীল করতে পারে সে নতুন ছন্দে স্থিতিশীল বিতরণ বজায় রাখতে সক্ষম হবে।

তাই দলটির আসলে যা আপগ্রেড করতে হবে তা হল কিউ ওয়ার্ড টেকনিক নয়, বরং ডেলিভারি সিস্টেম নিজেই: সম্পন্নের একটি নতুন সংজ্ঞা, যাচাইযোগ্য অনুমানের একটি তালিকা এবং রোলব্যাক খরচের ভাগ করে নেওয়ার সাথে একটি প্রকাশের শৃঙ্খলা। মৌলিক আউটপুট যত বেশি স্বয়ংক্রিয়, এই তিনটি জিনিসের মান তত বেশি।