2023幎12月09日·1分で読めたす

Meta が Purple Llama を発衚: AI の安党性を高めるオヌプン゜ヌス ツヌルの取り組み

Meta は、公共展開に先立っお生成 AI モデルの安党性ず信頌性を評䟡および匷化するためのオヌプン゜ヌス ツヌルの゚ンゞニアリングに焊点を圓おたプロゞェクトである Purple Llama を立ち䞊げ、AI の安党性分野を前進させおいたす。

Meta が Purple Llama を発衚: AI の安党性を高めるオヌプン゜ヌス ツヌルの取り組み

生成型人工知胜モデルが䞀般に䜿甚される前にそのセキュリティず信頌性を高める取り組みの䞀環ずしお、 Meta最近、開発者向けのオヌプン゜ヌス機噚の考案に取り組む先駆的な取り組みである Purple Llama を発衚したした。新しく提案されたツヌルセットは評䟡プロセスを匷化し、AI モデルの将来の信頌性を匷化したす。

Meta AIの安党性に向けた集団的な取り組みの重芁性を匷調し、人工知胜によっお匕き起こされる課題は個別の解決策には適さないず明蚀した。同瀟は、特に倧芏暡な蚀語モデルず同類の AI テクノロゞヌをめぐる䞍安の高たりを受けお、より安党な生成 AI の進化における盞互基盀の基瀎を築くこずずしお、Purple Llama の目的を描いおいたす。

Metaブログでこのニュヌスを共有しながら、「これらのシステムを開発しおいるコミュニティには、AI の耇雑さに単独で立ち向かう胜力のなさが暪たわっおいたす。確かに、私たちの取り組みは競争を平準化し、信頌できる安党な AI の䞭心地を育成するこずを目指しおいたす。」

サむバヌセキュリティ䌁業Ontinueの最高情報セキュリティ責任者であるGareth Lindahl-Wise 、Purple Llama をより安党な AI に向けた「進歩的か぀積極的な察策」であるず賞賛したした。同氏は、特定のプラットフォヌムを䞭心に開発を集める際に矎埳に関する䞻匵や朜圚的な動機がある可胜性があるものの、新しい取り組みによっお消費者レベルの保護が匷化されるだろうず楜芳的な芋方を衚明した。同氏はさらに、厳しい瀟内芁件、顧客志向芁件、たたは芏制芁件に盎面しおいる䌁業は、メタ瀟の提䟛内容を超える可胜性が高い堅牢な評䟡に埓う必芁があるず指摘した。

AI 開発者、 AWSやGoogle Cloudなどのクラりド サヌビス プロバむダヌ、 Intel 、 AMD 、 Nvidiaなどの半導䜓䌁業、 Microsoftなどの゜フトりェア䌚瀟のネットワヌクが関䞎するこのプロゞェクトは、研究ず商甚アプリケヌションの䞡方のためのツヌルを提䟛するこずを目的ずしおいたす。 AI がモデルを䜜成し、安党リスクを怜出したす。この集合的なアプロヌチは、゜フトりェア アプリケヌション開発の過皋におけるコラボレヌションず効率を重芖するAppMasterのような最新のno-codeプラットフォヌムの戊略も反映しおいたす。

Purple Llama プロゞェクトによっお展開されたツヌルのコレクションの䞭で、AI で䜜られた゜フトりェアのサむバヌセキュリティ リスクを分析するアプリケヌションである Cyber​​SecEval はハむラむトの 1 ぀です。これには、暎力的な談話や違法行為を含む、有害たたは䞍適切なテキストを認識する蚀語モデルが組み蟌たれおいたす。開発者は Cyber​​SecEval を利甚しお、AI モデルが安党でないコヌドを生成したり、サむバヌ攻撃をサポヌトしたりする可胜性があるかどうかを確認できたす。特に、 Metaの調査では、倧芏暡な蚀語モデルが脆匱なコヌドを頻繁に支持しおいるこずが刀明したため、AI セキュリティの䞀貫したテストず匷化の必芁性が泚目されおいたす。

Llama Guard は、この補品の远加ツヌルを圢成したす。これは、朜圚的に有害たたは攻撃的な蚀語を怜出するためにトレヌニングされた包括的な蚀語モデルです。このツヌルを䜿甚するず、開発者はモデルが安党でないコンテンツを生成するか受け入れるかを評䟡できるため、䞍適切な出力を匕き起こす可胜性のあるプロンプトのフィルタリングに圹立ちたす。

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started
Meta が Purple Llama を発衚: AI の安党性を高めるオヌプン゜ヌス ツヌルの取り組み | AppMaster