匿名用户2024年07月31日
13阅读
开发技术Pytorch
所属分类ai、text-to-image、lora
开源地址https://modelscope.cn/models/sd_lora/karaokeroom
授权协议Apache License 2.0

作品详情

日本のカラオケ店の、部屋の風景を学習させたLoRAです。

This LoRA is a trained karaoke room scene from a Japanese karaoke shop.

その後、培った経験を基に1から学習をやり直してみました。

V2の主な特徴

トリガー: karaokeroom
JOYPAD JOYSOUNDのキョクナビjoypadっぽいもの
DENMOKU でDAMのスマートデンモクっぽいもの
microphone でカラオケでよく見るワイヤレスマイクが描かれます
AT-CLM7000TX, microphone, だとオーディオテクニカAT-CLM7000TXが描かれる確率が上がります。
WM-610,microphone , だと JOYSOUND純正ワイヤレスマイクWM-610が描かれる確率が上がります。
DYNMIC, microphone, microphone stand, だと、SHURE SM58+マイクスタンド持ち込み可能…かもしれません。(マイクがおかしくなったり、ケーブルが消失したり、マイクスタンド変形しがちで、思ったように描いてくれません。無念。自分のマイクとマイクスタンドや楽器持ち込みのカラオケは楽しいんだけどなぁ…)

ドリンクバーのグラスがテーブルの上に勝手に配備されたりします。プロンプトでグラスとかストローとか書くと、グラスを手にして盛り上がりだしたりします。

キャラクターの描写や画風に影響が生じます。Weightは調整して使って下さい。

This will affect the depiction of the character and the style of the painting. Adjust the Weight.

V2-MIDDResizeDIM8 / V2-0008-MID5ResizeDIM8の特徴

カラオケ屋さんで撮った写真を学習用素材にしている関係で、2Dイラスト系モデルを使っても2.5D化したりリアル化してしまう傾向があります。

できるだけキャラへの塗り等の影響を抑えようとLoRA Block WeightでU- netの層ごとの働きを調べ、Supermergerで一部の層部分のみを取り出したLoRAを作成しました。

MIDD:0,0,0,0,1,1,1,1,1,1,1,1,0,0,0,0,0

MID5:0,0,0,0,0,0,0,1,1,1,1,0,0,0,0,0,0

その上でSD-Scriptsのリサイズスクリプトを使ってDIMサイズをDIM8にリサイズしたものがこの2種類になります。

画風への影響は抑えたことで、肝心の背景のカラオケ機器やJOYPADやデンモク・マイク等の小物のリアルさも表現されなくなってしまいますが、イラスト作成ではこちらの方が使いやすいケースもあるかと思います。使用するモデルやお好みで各バージョンを使い分けしていただければと思います。

SDXL版も試作してみました!

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论