در حالی که ابزارهای کدنویسی هوش مصنوعی هر ماه میلیاردها خط کد تولید می کنن، یه چالش جدید داره به وجود می آید: اطمینان از این که نرم افزار دقیقا همون طوری که انتظار می ره کار می کنه. اینجاست که اهمیت راستی آزمایی کد هوش مصنوعی مطرح می شه. Qodo، یه استارتاپ که داره ایجنت های هوش مصنوعی برای بررسی کد، تست و حاکمیت می سازه، روی این موضوع شرط بندی کرده که مرحله بعدی توسعه نرم افزار رو «تایید اعتبار» تعریف می کنه.
این استارتاپ که دفتر مرکزیش توی نیویورکه، 70 میلیون دلار در دور سری B به رهبری Qumra Capital جذب کرده که مجموع سرمایه گذاری هاش رو به 120 میلیون دلار می رسونه. شرکت های Maor Ventures، Phoenix Venture Partners، S Ventures، Square Peg، Susa Ventures، TLV Partners، Vine Ventures و همچنین پیتر ولیندر (OpenAI) و کلارا شیه (Meta) هم توی این دور سرمایه گذاری شرکت کردن.
چرا راستی آزمایی کد هوش مصنوعی ضروری است؟
هدف Qodo اینه که به عنوان لایه ای عمل کنه که روی افزایش اعتماد به کدهای تولید شده توسط هوش مصنوعی تمرکز داره، اونم در حالی که سازمان ها دارن سریع تر از ابزارهایی مثل OpenClaw و Claude Code استفاده می کنن. خیلی ها دارن متوجه می شن که خروجی سریع تر کد، لزوما به معنی نرم افزار قابل اعتماد یا امن نیست. این نیاز به راستی آزمایی کد هوش مصنوعی رو پررنگ تر می کنه.
در حالی که اکثر ابزارهای بررسی هوش مصنوعی روی تغییرات ایجاد شده تمرکز دارن، Qodo روی این تمرکز می کنه که تغییرات کد چطور روی کل سیستم تاثیر می ذارن. این ابزار با در نظر گرفتن استانداردهای سازمانی، سوابق قبلی و میزان ریسک پذیری، به شرکت ها کمک می کنه تا کدهای تولید شده توسط هوش مصنوعی رو با اطمینان بیشتری مدیریت کنن و فرآیند راستی آزمایی کد هوش مصنوعی رو بهینه سازی کنن.
ایتامار فریدمن، که قبلا هم بنیان گذار Visualead بوده و بخش بینایی ماشین رو در علی بابا (که Visualead رو خرید) مدیریت می کرد، Qodo رو در سال 1401 (2022 میلادی) تاسیس کرد. اون به تک کرانچ گفت که دو لحظه کلیدی در دوران حرفه ایش زمان حضورش در Mellanox (که بعدا توسط انویدیا خریداری شد) و ساخت Visualead الهام بخش اون برای شروع Qodo، درست چند ماه قبل از عرضه ChatGPT بوده.
در Mellanox، جایی که روی خودکارسازی تایید سخت افزار با استفاده از یادگیری ماشین کار می کرد، متوجه شد که «تولید سیستم ها و تایید اون ها به رویکردهای کاملا متفاوتی (ابزارهای متفاوت، طرز فکر متفاوت) نیاز داره.» بعدا در آکادمی دامو علی بابا، شاهد تکامل هوش مصنوعی به سمت سیستم هایی بود که می تونستن روی زبان انسان استدلال کنن. در بازه زمانی 1400-1401 (2021-2022 میلادی)، درست قبل از GPT-3.5، برای اون روشن شد که هوش مصنوعی بخش بزرگی از محتوای جهان به خصوص کد رو تولید می کنه؛ موضوعی که دیدگاهش رو تقویت کرد: تولید کد و تایید کد به سیستم های کاملا متفاوتی نیاز دارن. این دیدگاه ضرورت راستی آزمایی کد هوش مصنوعی را در عصر جدید نشان می دهد.
یه نظرسنجی جدید نشون می ده در حالی که 95٪ از توسعه دهنده ها به کدهای تولید شده توسط هوش مصنوعی اعتماد کامل ندارن، اما فقط 48٪ اون ها رو قبل از ثبت (commit) بررسی می کنن. این موضوع نشون دهنده شکاف بین آگاهی و عمله و لزوم بهبود فرآیندهای راستی آزمایی کد هوش مصنوعی است.
فریدمن گفت: «شرکت های تولید کد عمدتا حول مدل های زبانی بزرگ (LLM) ساخته شدن. اما برای کیفیت کد و حاکمیت، LLMها به تنهایی کافی نیستن. کیفیت یه موضوع ذهنیه و به استانداردهای سازمانی، تصمیمات گذشته و دانش تیمی بستگی داره. یه LLM نمی تونه این بستر رو کاملا درک کنه. این درست مثل اینه که یه مهندس عالی رو از یه شرکت بیاری و ازش بخوای کدهای شرکت دیگه ای رو بررسی کنه اون شخص اطلاعات زمینه ای داخلی رو نداره. به همین دلیل، ابزارهای تخصصی برای راستی آزمایی کد هوش مصنوعی حیاتی هستند.»
فریدمن توضیح داد که شرکت هایی مثل OpenAI و Anthropic دارن به شکل گیری روایت کلی هوش مصنوعی کمک می کنن، از جمله در حوزه های مرتبط مثل بررسی کد؛ اما اون ها بیشتر روی ساخت قابلیت ها تمرکز دارن تا راهکارهای جامع. این مدیرعامل اشاره کرد که با وجود استارتاپ های دیگه در این حوزه، خیلی هاشون هنوز در مراحل اولیه هستن و هنوز مورد استفاده گسترده سازمانی قرار نگرفتن.
رویکرد Qodo در راستی آزمایی کد هوش مصنوعی
Qodo برای متمایز شدن در این بازار شلوغ، روی عملکرد تمرکز کرده. این استارتاپ اخیرا در بنچمارک بررسی کد Martian رتبه اول رو کسب کرد و امتیاز 64.3٪ رو به دست آورد که بیش از 10 امتیاز از رقیب بعدی و 25 امتیاز از Claude Code Review جلوتره. این بنچمارک توانایی اون در پیدا کردن باگ های منطقی پیچیده و مشکلات بین فایلی رو نشون می ده، بدون اینکه توسعه دهنده ها رو با هشدارهای بیهوده کلافه کنه.
در ماه گذشته، این شرکت Qodo 2.0 رو عرضه کرد؛ یه سیستم بررسی کد چند-ایجنت که الان در بنچمارک های فعلی پیشتازه. این نسخه جدید توانایی Qodo را در راستی آزمایی کد هوش مصنوعی به طور چشمگیری افزایش داده است. همچنین ابزارهایی رو معرفی کرده که تعریف هر سازمان از کیفیت کد رو یاد می گیرن.
این شرکت در حال حاضر با سازمان های بزرگی مثل انویدیا، والمارت، Red Hat، Intuit و Texas Instruments و همچنین شرکت های در حال رشدی مثل Monday.com و JFrog همکاری می کنه.
فریدمن گفت: «هر سال یه لحظه تعیین کننده داشته از Copilot گرفته تا ChatGPT و حالا خودکارسازی کامل وظایف. الان داریم وارد مرحله جدیدی می شیم: حرکت از هوش مصنوعی بدون وضعیت (stateless) به سیستم های باوضعیت (stateful) از هوشمندی به سمت خرد مصنوعی. این تحولات با پیش بینی هوش مصنوعی در کسب وکارها برای سال های آینده کاملا همخوانی دارد و Qodo برای رهبری این مسیر ساخته شده است.»
تحولات اخیر در دنیای توسعه نرم افزار نشان می دهد که هوش مصنوعی به سمتی پیش می رود که تایید اعتبار کد به اندازه تولید آن اهمیت پیدا کرده است. با ورود استارتاپ هایی مانند Qodo به این عرصه، سازمان ها می توانند با اطمینان بیشتری از مدل های زبانی برای تسریع پروژه های خود استفاده کنند، بدون اینکه نگران باگ های منطقی یا نقض استانداردهای داخلی باشند. در نهایت، توازن میان سرعت و دقت، کلید موفقیت در عصر جدید برنامه نویسی خواهد بود.