マガジンのカバー画像

AI_HIKE Voice

22
Hi君として公開していた「HIKE Tech note」を今後はこの「HIKE Voice」で投稿していきます。過去記事はキュレーションとして公開いたします。
運営しているクリエイター

記事一覧

生成画像の類似度を評価する#1

こんにちは!Hi君です。 画像生成AIを触っていると、生成画像の選抜が必要になる時があります…

Hi君
1年前
6

フルスクラッチ学習に必要な計算機リソース・時間・パブリックライセンスデータ入手先…

こんにちは!Hi君です。 前回は「参考になるリポトジ・記事」に関してご紹介しましたが、今回…

Hi君
1年前
8

フルスクラッチ学習に必要な計算機リソース・時間・パブリックライセンスデータ入手先…

こんにちは、Hi君です。 Stable Diffusionに利用するモデルについて、訓練を行う際にどの程度…

Hi君
1年前
6

Mitsua Diffusion Oneの表現能力・モデル概要まとめ

こんにちは、Hi君です。 Mitsua Diffusion Oneと呼ばれるパブリックドメイン/CC0および許諾を…

Hi君
1年前
5

キャラクターの同一性を保つ形での画像生成について

こんにちは!Hi君です。 以前、「ControlNet v1.1」における表情制御について取り上げました。…

Hi君
1年前
8

video2video関連 動画データに対しての画風変換・生成まとめ

こんにちは、Hi君です。 こちらも少し古い情報にはなりますが、せっかく調べたので記事として…

Hi君
1年前
4

ControlNet v1.1を用いた表情制御について

こんにちは!Hi君です。 AI画像生成において不可欠な技術である「ControlNet」。今回は、その新バージョンである「ControlNet v1.1」について色々と試してみてわかったことをまとめました! ■調べてみてわかったこと ・ControlNet v1.1ではMediaPipeFaceモード、mediapipeを用いた顔認識 + 表情制御用ガイダンス情報を付与しながら画像生成するような拡張機能が追加された。  ▶今までは表情制御用の拡張機能は無く、Cannyエッジ

OpenPoseやControlNetのソフトウェアライセンス関連のまとめ

こんにちは!Hi君です。 本日はOpenPose及びControlNetのソフトウェアライセンス関連について…

Hi君
1年前
18

あえて話したい!Stable Diffusion周辺の理論・内部実装。読んでおくべき記事の紹介

こんにちは、Hi君です。ついに梅雨入りし、なんとなく気が滅入る日が多くなりましたね。 そん…

Hi君
1年前
10

LLMの実利用をより柔軟に、簡易に行う「LangChain」とは?

こんにちは!Hi君です。 今回の記事ではLangChainと呼ばれるツールについて解説します。 少し…

Hi君
1年前
7

使い方は人次第?GLIGENとは

こんにちは、Hi君です。 今回はバウンディングボックスとプロンプトを指定し、指定した領域に…

Hi君
1年前
8

Deforumをさわってみた。

こんにちは、Hi君です。蒸し暑い日が少し多くなりましたね。今にも梅雨がやってきそうな気配を…

Hi君
1年前
8

ついに3Dも!3Dシーンを生成するNeRFに関して

こんにちは!Hi君です。 今回は3Dに関してです。少し長くなりますがお付き合いください。 3D…

Hi君
1年前
11

ChatGPT・Large Language Model(LLM)概要解説【後編】

こんにちは!Hi君です。 前編では「ChatGPT」について解説しました。後編ではそもそもの技術としてLarge Language Model (LLM) についてまとめてみます。 LLMとは■LLMとは何か ・LLMは、大量のテキストデータを学習して自然言語処理を実現するためのモデル、あるいは技術体系を指します。  ▶ChatGPTはLLMを利用したサービスです。  ▶LLMには深層学習(Deep Neural Network)と呼ばれる種類の数理モデルが用いられていま