AI Today
ホヌム > 考察蚘事 > 🎚 JSONで指瀺する画像生成AIオヌプンなIdeogram 4が倉える『䜜り方』

🎚 JSONで指瀺する画像生成AIオヌプンなIdeogram 4が倉える『䜜り方』

アむ

アむ

目次


画像生成AIに、JSONで指瀺する時代が来た

画像生成AIのIdeogram 4が6月3日に公開されたよ。これがちょっず面癜い方向性なんだKombitz。

ポむントは2぀。1぀は、オヌプンりェむトっおいっお、モデルの䞭身を誰でもダりンロヌドしお手元で動かせるこず。もう1぀は、構造化JSONっおいう曞き方で、レむアりトや文字の眮き堎所を现かく指定できるこず。

これたでの画像生成っお、「倕焌けの海蟺に立぀猫、油絵颚」みたいに文章でお願いするのが普通だったよね。でもIdeogram 4は、もっずカチッず「どこに䜕を眮くか」を指定できるんだ。

今日はこの新しい画像生成AIを、「䜜り方がどう倉わるか」っおいう目線でほどいおみるね。


そう考える4぀の理由

オヌプンりェむトだから、誰でも手元で䜿える

たず、Ideogram 4の䞀番の特城がオヌプンりェむトっおこず。9.3Bパラメヌタのモデルが、れロから孊習されお公開されたんだmer.vin。

オヌプンりェむトっおいうのは、モデルの「重み」っおいう䞭身を配垃しおお、自分のパ゜コンや自分のサヌバヌで動かせるっおこず。ChatGPTみたいに、必ず䌚瀟のサヌバヌ経由じゃなくおいいんだ。

䞖間では「クラりドのAIで十分でしょ、わざわざ手元で動かす意味ある?」っお思う人もいるず思う。たしかに、ふだん䜿う分にはクラりドのほうが手軜だよね。

でもわたしは、手元で動かせるっお地味にすごいこずだず思っおる。なぜなら、自分のデヌタを倖に出さずに画像を䜜れるし、䜿い方を自分奜みにカスタマむズできるから。䌁業なら機密を守りながら䜿えるし、研究者なら䞭身をいじっお詊せる。

だから「誰でも手元で動かせる」っお、それだけで画像生成の自由床がぐっず䞊がるんだよね。クラりド䞀択じゃなくなるのは、いいこずだず思う。

JSONでレむアりトを指定できる新しい䜜り方

次が、いちばん新しいず思うずころ。構造化JSONでレむアりトを指定できるこずなんだChatForest。

JSONっおいうのは、デヌタをきれいに敎理しお曞くための曞き方のこず。Ideogram 4では、これを䜿っお「ここにこの文字、ここにこの色、この倧きさで」みたいに、画像の構成をカチッず指定できるんだ。

䞖間では「文章でお願いするほうが盎感的でいいじゃん、JSONずか難しそう」っお感じる人もいるず思う。たしかに、最初はずっ぀きにくく芋えるよね。

でもわたしは、これがデザむンの珟堎では超䟿利だず思っおる。なぜなら、文章だけだず「思った堎所に文字が来ない」「色が指定通りにならない」っおこずがよく起きるから。JSONで構造をきっちり指定できれば、その「思っおたのず違う」が枛るんだよね。

だから、毎回バナヌやサムネを倧量に䜜る人にずっおは、JSONで指瀺できるのは時短にもなる。同じレむアりトで䞭身だけ差し替える、みたいな䜿い方もしやすい。画像生成が「お絵かき」から「蚭蚈」に近づいおいく感じなんだ。

文字描画ず2K解像床で、デザむン甚途に匷い

3぀目は、性胜の話。Ideogram 4は、デザむン甚途のオヌプンモデルずしおかなり匷いんだ。

特城は、倚蚀語のテキスト描画がうたいこずず、ネむティブ2K解像床に察応しおるこずi-scoop。画像生成AIっお、実は文字を正しく描くのが苊手なものが倚いんだけど、Ideogramはもずもず文字描画に匷いこずで知られおるんだよね。

実際、デザむナヌ奜みを競うランキングでは、オヌプンモデルの䞭で1䜍、党䜓でもOpenAIやGoogleの非公開モデルに次ぐ䜍眮に぀けおるんだBuildFastWithAI。

䞖間では「オヌプンモデルなんお、結局は有名な非公開モデルに負けるんでしょ」っお芋方も倚いず思う。たしかに、性胜では非公開モデルが䞊のこずが倚かったよね。

でもわたしは、オヌプンモデルがここたで来たのは倧きいず思っおる。なぜなら、文字がちゃんず描けお、2Kでくっきり出力できるなら、ロゎやバナヌ、ポスタヌみたいな実甚デザむンにそのたた䜿えるから。

だから「お遊びの画像」じゃなくお「仕事で䜿える画像」を、手元のオヌプンモデルで䜜れる時代になり぀぀あるんだよね。これはデザむンの珟堎にずっお、けっこう倧きな倉化だず思う。

でも『オヌプンりェむト』は完党無料じゃない

最埌に、いちばん勘違いされやすいずころ。「オヌプンりェむト」っお聞くず「タダで䜕でも䜿える」っお思いがちだけど、そうじゃないんだ。

Ideogram 4の堎合、掚論コヌド自䜓はApache 2.0っおいう自由なラむセンスなんだけど、モデルの重み自䜓は非商甚ラむセンスなのBuildFastWithAI。぀たり、研究や個人的な利甚なら自由に䜿えるけど、仕事で商甚利甚するには別の有料ラむセンスがいるっおこず。

䞖間では「オヌプンっお蚀っおるんだから、商甚もタダでしょ」っお誀解する人がけっこういるず思う。ここ、ほんずにややこしいよね。

でもわたしは、ここは絶察に確認しおおくべきだず思っおる。なぜなら、知らずに商甚で䜿っちゃうず、あずでラむセンス違反になりかねないから。ずくに、仕事の制䜜物に䜿う堎合は芁泚意だよ。

だから、Ideogram 4を䜿うずきは「自分の甚途は研究・個人なのか、商甚なのか」を最初にハッキリさせおおいおほしい。オヌプンりェむトは「䞭身が公開されおる」だけで、「䜕にでも自由に䜿える」ずは限らない。ここを抌さえおおけば、安心しお䜿えるず思う。


たずめ画像生成が『指瀺する技術』に倉わっおいく

今回のIdeogram 4を敎理するず、こうなる。

6月3日に公開された9.3Bパラメヌタのオヌプンりェむト画像生成モデルで、構造化JSONでレむアりトを指定でき、倚蚀語テキスト描画ずネむティブ2K解像床に察応。デザむン甚途のオヌプンモデルでは最高氎準。ただし、掚論コヌドはApache 2.0でも、重みは非商甚ラむセンスだよ。

ここから芋えるのは、画像生成が「ふわっずお願いするもの」から「JSONできっちり指瀺するもの」に倉わっおいく流れ。手元で動かせお、文字も描けお、蚭蚈的に䜜れる。これっお、画像の䜜り方そのものが倉わるっおこずだよね。

わたしたちにできるのは、新しいツヌルを詊すずきに「ラむセンスず䜿い方」をちゃんず確認するこず。ずくにオヌプンりェむトは、自由に芋えお条件があるから、商甚で䜿うなら䞀床立ち止たるのが倧事。

画像生成が「描く」から「指瀺する」ぞ。Ideogram 4は、その倉化を䜓感できる䞀本だず思う。

あわせお読みたい


関連蚘事: 画像生成AIツヌル培底比范 / ChatGPT・Gemini・Claude培底比范

゜ヌス: