Databricks がドリー 2.0 をリリースしました。これは、商用利用のための最初のオープンな命令に従う LLM です。 from venturebeat.com


同社によれば、Dolly 2.0 は、商用目的で使用するためにオープンソース化されている透明で自由に利用できるデータセットで微調整された、最初のオープンソースで命令に従う LLM です。
Databricks の CEO である Ali Ghodsi 氏によると、商用目的で使用できる LLM は他にもありますが、「Dolly 2.0 のように話しかけることはありません」と説明し、ユーザーはトレーニング データを変更および改善できると説明しました。
Databricks は、Dolly 2.0 がトレーニングされたデータセットをリリースしました
さらに、Databricks は、オープン ソースへの継続的な取り組みの一環として、databricks-dolly-15k と呼ばれる、Dolly 2.0 がトレーニングされたデータセットもリリースしていると述べました。
これは、何千人もの Databricks 従業員によって生成された 15000 を超えるレコードのコーパスであり、Databricks は、「大規模な言語が ChatGPT の魔法のような対話性を発揮できるように特別に設計された、最初のオープン ソースで人間が生成した命令コーパス」であると述べています。
「コミュニティ全体がこっそりとこの問題に取り組んでおり、誰もがこれらのモデルをリリースしていますが、どれも商業的に使用することはできませんでした」と Ghodsi 氏は述べています。

コメント

タイトルとURLをコピーしました