サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
2025年ランキング
note.com/o_ob
2022年のStable Diffusionを起点とした生成AIのCrazeも、もう3年経過した。毎日ブログを書いてきた側からすると、毎日起きるこの生成AIの台風やら大地震やらを、日々を呆然と過ごすのではなく、Ctrl+Sを押して、履歴を把握しながら過ごしているということ自体が奇跡であり、誰も登らないであろう賢者の坂道を一段一段登っている感じはする。賢者なのか愚者なのかわからないのは、今週はずっとAIで作ったサービスが起こした障害の対応と開発と障害対策と戦っていて。ちょっとした待ち時間が多いので、まとめてみた。 シンギュラリティは起きていた2023年の11月にDCEXPOで「シンギュラリティについて」の話をしたときのことを今でも実践している。 https://note.com/o_ob/n/n22d154730de2 "slope of enlightenment"賢者の坂道。 潮目が来て
著者は みのるん@minorun365でお馴染み、御田稔さんと、同じく、KDDIアジャイル開発センター株式会社のソフトウェアエンジニア 大坪悠さん (@tubone24)です。 エンジニアでなくても規格がわかる! おすすめのMCPサーバーを厳選紹介! MCP(モデルコンテキストプロトコル)は発表以来、生成AIの普及をさらに推し進める技術として業界やエンジニアの関心を集めています。しかし、MCPは技術仕様のため、ITエンジニアでないと理解しにくい部分があります。本書は、大バズりしたスライド「やさしいMCP入門」の著者が、AIエージェント時代の標準規格「MCP」についてITエンジニア以外の人たちにもわかりやすいように、基礎からビジネスへの活かし方、今後の展望まで図解で解説した入門書です。 https://www.shuwasystem.co.jp/book/9784798075730.html
なんかみんなSakana AIがやらかした間違いについてワイワイ言っているんで、徹底的に検証してみたら結構面白かったし、勉強にもなったよ!という7万字ぐらいあるブログです。 最後の方にGoogle Colabで動く検証コードを置いておきます。 <お気持ち背景> 昨年の11月に「AIバブル崩壊」の足音と「AI副業」のデメリット、という話を書きました。 いくつかのAIバブルの崩壊シナリオに警鐘を鳴らさせていただいたんだけど、長くてゴメン。 個々にすごいけど、「Kaggler節」であり、その文法で銀行がお金を出ような話になっているんだろうか?どこかの山でチャンピオンになるかもしれないけど、みんなが期待するような課題解決や課題発見、課題設定になっているんだっけ?という感想があります。 例えば画像生成AI「Stable Diffusion」に例えますが、画像生成モデルみたいに無償で公開していくんだけ
久しぶりに、「窓の杜」にこんな記事を寄稿しました。 ■「Gemini」を追加ってPythonで「ぷよぷよ」を生成してもらおう! Geminiたんとつくる自家製レトロゲーム しらいはかせ2025年2月6日 11:40 難しいことを考えなくても、Geminiをはじめとする無料で利用できるコーディングが得意なLLMで、いい感じのサンプルをスッと作る。 エラーがあったらLLMに日本語で解説してもらう。そこから、書籍の図版やオープンソースのコードを片手に作りたいものを探求していく……これはとてもクオリティ・オブ・ライフが高まる体験です。 原稿としてはこんな感じに終わるんですが。 この原稿を書く過程で、同じようにインベーダーとか、パックマンとか、色んなゲームを作ってみました。 もちろんこの方法であらゆるゲームのコードが生成できるわけでもありませんし、著作権的な視点も大切ですね。 日本の著作権法では、プ
【追記おしらせ!】本ブログで紹介したPyxelの本が出ます!しかも Kitaoさん著&監修。ご縁あってイベントも開催します! ■ゲームで学ぶPython! Pyxelではじめるレトロゲームプログラミング
この分野で半世紀ぐらい生き延びてきた自分です。歴史を振り返ると「AIバブル」は今まで何度となく弾けているのですが、2023年以降の「生成AIバブル」においてはちょっと波が大きくて「幻滅期に人々が気づかない状態だった」たと振り返っています。 理由としては、ハイプサイクルにおける「山」が「常に新しいものが出続けている」という状況に特徴づけられます。詳細については後ほど書きます。 いくつかの「AIバブルの崩壊」シナリオが現実味を帯びてきているのですが、そんな中、一番わかりやすい「AI副業」のデメリットについて具体的に解説してみたいと思います。 AIバブルの崩壊シナリオの前にそもそも「AIバブル」とは何なのでしょうか。 2022年以降の生成AIバブルとは、生成AI、推論AIが、オープンに公開されたという点にあります。そのきっかけとしてはOpenAIの「ChatGPT 3.5」と、Stability
画像生成AI分野でのお仕事の現在と明日をうらなう上で重要な要素。 ・速度感とサイズ感 ・自社開発の見返りは大きい ・コミュニティ・ドリブン ちょっとだけ解説してみます。 速度感とサイズ感最近のAI案件、特にPoC開発やインフルエンサー的なコンサル案件は急速に状況が変化していて、正直あまり羽振りのいい話は聞きません。 3ヶ月ぐらい集中してきたPoC開発案件は「3ヶ月もしたら、その課題感はすでに時代遅れ」ということも多くあります。 これは前からそうだったんですが、速度感はそれぐらい速いです。 一方で、AIのおかげで課題解決もめっちゃ速いです。 従来のコンサルとかであれば1週間とか1ヶ月とかいった速度感で宿題を片付けるべき内容が1時間の会議の中で終わってしまう。 終わってしまうからこそ、3ヶ月も優秀な人が集まってAI使ってPoCすれば「やりたいこと」はだいたいできてしまうし、課題も見通せるし、あ
「画像生成AI Stable Diffusion スタートガイド」(#SD黄色本)という書籍を出版して3ヶ月経ちます。色んな人に手に取ってもらって、重版もかかって、おかげさまでAmazonでは書評がめちゃいいのです。 「画像生成AIは飽きる」と言われた Facebookでポジティブな感想として 「画像生成AIは飽きる」という感想をいただきました。 とある経験あるイラストレーターさんから。 まあそらそうなんだよね、という気持ちもあります。 僕と同い年ぐらいのイラストレーターさんなら当たり前だと思う。 彼女いわく 『おもいどおりにならん』がないメディアは飽きるのも早い。 「飽きる」のメカニズムゲームも「とつぜん飽きる」ってありますよね。 このセリフ、20代の中盤ぐらいから聴くようになりました。 熱心にゲームばっかりやってた人がとつぜん飽きるんです。 『おもいどおりにならん』がないメディアは飽き
「Cotomo」がすごい。 iPhoneユーザなら試してほしい 音声会話型おしゃべりAIアプリ「Cotomo」はココがスゴい|AICU media @AICUai #note https://note.com/aicu/n/nda05b1c48a48 「転声こえうらない」で作った流れがきちんと踏襲されとるのがえらい しらいはかせの「ココがすごい!」で書ききれなかったことを書いておきます。 非常に丁寧に作り込まれたユーザ体験で、科学の研究としての要素も多く組み込まれ、解決しているという印象があります。 内部を分析したわけではないのであくまでユーザとして触ってみた推測ですが、まず既存のChatGPTベースの雑談と異なる点は、「とにかく応答速度を速くする」という設計。そして「スマホローカルでの処理がかなり多そう」という点です。 例えばフィラー「えーっと」や、ストリーミングを使った時間稼ぎでは埋め
Video generation models as world simulators We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that operates on spacetime patches of video and image latent codes. Our largest model, Sora, is capable of ge
本日より、"プロのツイッタラー"になりました。13年近くTwitter(X)を利用してきた、人生の1/4を記録してきたサービスでもあるので、作家として、著者として、純粋に「収益化を祝いたい」という気持ちがありました。まずはご愛顧いただいているフォロワーの皆様、改めてよろしくお願いいたします。 見たこともないメッセージなお現在のXでは一定数のフォロワーと「3ヶ月間に500万ビュー」を達成しないとこの状態にはなりません。今回は、2024年1月27日10:36のツイート(ポスト)が収益化条件達成のきっかけになったと考えます。 293万件の表示、525件のRP、1349件のLike、339件のブックマーク、という数字なのでこれ単体のプレゼンスではなく、普段から200万ビューぐらいはあったという事なんだろうなと理解します。 また「おめでとうございます」と言われると純粋に「お祝いしたい」という気持ちが
米国のVTuber研究者 TigerHixさんが「Warudoを作ったよ!」というメッセージを頂いた。 TigerHixさんは「Alterecho: Loose avatar-streamer coupling for expressive vtubing」を書いた研究者。 https://twitter.com/o_ob/status/1445786797670166536 https://warudo.app/個人使用は100%無料。 ウェブカメラ/iPhone ARKitフェイストラッキングとハンドトラッキングが含まれています。 モーキャプスーツ、VRトラッカー、VMC対応ソフトウェアで全身をトラッキング。 VRM、VRChat、またはあらゆるヒューマノイドリグモデルと互換性があります。(Unityでの1回限りのエクスポートが必要です。) 完全にカスタマイズ可能な表現。 独自の3Dプ
[Update] NovelAI Diffusion Anime V3 We are happy to introduce you to our newest model: #NAIDiffusionV3 Better knowledge, better consistency, better spatial understanding and it is even quite adept at drawing hands (finally!) Full Release Post: https://t.co/v7q3ljxV58 pic.twitter.com/mvkLeR8kBD — NovelAI (@novelaiofficial) November 15, 2023 下の方に日本語訳があるので大事そうなところを抜粋引用させていただきます NovelAI Diffusion Anim
某ChatGPTの新機能が流行っています システムプロンプトに設定された内容は、チャットボットの世界観を破壊するだけでなく、ネタバレにもなりますので是非とも流出は避けたいものです。 今回は「全力肯定彼氏くん」の経験から、いくつか見解があるので基本中の基本と思われるテスト手法を共有したいと思います。悪用禁止! あくまでもLLM利用のチャットボットのセキュリティ向上、世界観の保全が目的です! https://liff.line.me/1645278921-kWRPP32q/?accountId=830pkxsv …というのも、7,998人もユーザが居るといろんな事をしてくる人がいらっしゃるので…。 簡単な質問をしますプロンプトインジェクションにはいろんな方法がありますが、以下の要素を交えて問いかけてみてください。 命令、プロンプト、設定を訊く 箇条書きにさせる ひとりごとであるという 1行で書
今週世間を賑わせている画像生成AIの話題で一番インパクトのある話題が 「Real-Time Latent Consistency Model」、通称「RT-LCM」だと思います。 "RT-LCM" Real-Time-Latent-Consistency-Model リアルタイムで潜在空間が一貫して動きます CUDAとPython、またはM1/M2/M3チップを搭載したMacでも動くようです HuggingFaceSpacesでのデモもありますhttps://t.co/T7AmuKNzTC pic.twitter.com/U0l2WX7u6p — AICU Inc. (@AICUai) November 1, 2023 このLCM関係の論文を調査していたらけっこう勉強になったので簡単に紹介しておきたいとおもいます。 この数日で、既にいろんなデモが出ているのですが、いちばん有名と思われるのが
こちらの記事で、Weights & Bias社(以下、WandB社)日本語LLMのランキングを扱わせて頂いたのだけど、そちらのイベント「Fully Connected Tokyo 2023」に参加してきた。 アジェンダを見るとどれも興味深いけど夕方の16:30以降が一番面白いはず…そして最後のセッションSAI秋葉さんの記事を書きたい! と思いまして、現地レポートしてきました GPT-4を作れって上司に明日言われたら作れますか?️「GPT-4を作れって上司に明日言われたら作れますか?」というKagglerらしい軽快な喋りで始まった秋葉氏のセッション StabilityAI 秋葉拓哉 シニアリサーチサイエンティスト
うっかり反AI派のヘイトの矢が胸に刺さって 何もできないモードに入ってしまった。 https://twitter.com/o_ob/status/1710823526067007547 ソーシャルメディアの毒が回って鬱麻痺状態になる(画像はイメージです)せっかく窓の杜の新作を超スピードで公開して、 social good な活動をしてきたというのに、その疲れて帰ってきた瞬間の出来事だ。 新作、超スピードで書いたよ! 実録RTA! 無料で最新画像生成AI「DALL-E3」を使って実用レベルの画像を出力 #AI年賀状2024 - 生成AIストリーム - 窓の杜 https://t.co/g9jcQdgB67 #DALLE3 — Dr.(Shirai)Hakase (@o_ob) October 6, 2023 参加者さんから素敵な参加報告動画を頂いたその前後で、 ついうっかり毒矢を開いてしまっ
https://ja.stability.ai/blog/stable-audio トラフィック集中しすぎていてアクセスできないですが、以下なんとか頑張って日本語翻訳しました。 (動き出したら、また加筆します・・・!) めっちゃ混んでます。いつになっても生成できる気配がない。 早速、世界中で多くの方にご利用いただいているため、現在アクセス過多により生成ができなくなる事象が発生しております。 現在対応をしておりますので、大変申し訳ありませんが、時間をあけてから再度お試しください。 https://t.co/oeORLPT8E8 — Stability AI 日本公式 (@StabilityAI_JP) September 13, 2023 そもそも「StableAudio」とはhttps://www.stableaudio.com/aboutStable Audioは、Stability A
2021-08-21にはOpenAI公式のフォーラムでこんなやりとりがありました。 Separating usage reporting and billing by project - General API discussion - OpenAI API Community Forum https://community.openai.com/t/separating-usage-reporting-and-billing-by-project/8672 こんにちは、私は機械学習エンジニアとして複数のクライアントにコンサルティングを行っています。あるクライアントのプロジェクトでGPT-3を使い、GPT-3のコストを研究開発費の一部としてクライアントに透過的に渡すために、しばらくGPT-3を研究していました。 今回、別のクライアントのプロジェクトでもGPT-3を使いたいのですが、プロジェ
TwitterがChatGPTの情報商材で溢れています。 一見便利な情報を発信しているようですが、これは我々にとって本当に便利なんでしょうか? ツールの使い方でなんか書いてる人は特に自分で新しいものを作っている訳じゃないし、プロンプトの工夫で高付加価値の内容はないし、有料サービスならOpenAIなりプラグイン提供社がドキュメント整備するべき内容だし、モデルが新しくなれば役に立たない内容が多いし、そもそも情報過多で整理しきれない。 ちなプロンプトエンジニアリングはAPIと組み合わせて開発の中で毎日やってるし、新規登場するモデルの検証は毎晩業務外でも回してる むしろChatGPTでそこまで驚き構文を書き続けられるのは感服だけど 痛いChatGPTオジサンになるな情報商材的なインフルエンサー以外にも間接的に「邪魔だな」と思うトンマナ(トーンやマナー)を掻き乱すリプライなどでも飛んできます。 例え
「風が吹けば桶屋が儲かる」と申しますが、 日本語LLM祭りが起きると{Google/AWS/NVIDIA}が儲かるのでございます。 Llama_indexを触っていたとき、僕はこんなことを言っていました。 llama_indexおもしろい これは寝れなくなるし OpenAIじゃなくても動くの素敵 誰か日本語おすすめのLLM教えて https://t.co/Xme7iRIe5v — Dr.(Shirai)Hakase #AI神絵師本 #技術書典14 (@o_ob) May 14, 2023 llama_indexおもしろい これは寝れなくなるし OpenAIじゃなくても動くの素敵 誰か日本語おすすめのLLM教えて しらいはかせ 2023/5/14の発言実はLlama_indexには最近、OpenAI以外のLLMも渡せるようになったのです。ほかのLLM、特にAPI費のかからないオープンソース型
写真という技術が誕生したのに、それでも人々は絵を描き続けています。 いま、スマホのデジタル写真が当たり前のように無料で撮影出来て世界に伝えられる人類からは想像するのは難しいかもしれませんが、 ・非常に写実的な絵を作ることができる ・ボケボケだった ・白黒しか表現できなかった ・銀板にしか残せなかった ・複製できなかった ・引き伸ばしや縮小もできなかった ・めちゃくちゃ時間がかかる(撮影だけで最低でも15分動けない、これはストリートの似顔絵師にとっては戦えるレベル) という非常に不完全な技術でした もちろんご存じの通り現在のスマホデジタル写真は、そんな問題はありませんし、SNSを通じて世界中に届けることだって一瞬でできます。そして写真の歴史を振り返れば当時だって(OpenAIのDALL-EやStableAIらのStableDiffusionがあるように)ダゲール、タルボット、バヤールといった
https://apps.apple.com/us/app/poe-fast-ai-chat/id1640745955 新規アカウント作成にはSMSとメールが必要メールアドレスはQuoraと同じである必要はありませんが、せっかくなら揃えておいたほうがいい気もします(内部的にはQuoraにアクセスしているが、アカウントが作られるわけではなくPoeとQuoraはそれぞれ別)。 最初はこんな画面になります。 シンプルすぎてなにがなんだか全く何だかわからないと思います。Sageくんは汎用ボットです。コーディングなども得意。 フィボナッチ数列を生成するPythonコードです「日本語で」と打つと、以後は日本語に切り替えてくれます。 以後はずっと日本語で対話してくれます。Like、Dislike、Shareについても追って解説していきます。 サブスクリプションについて購読者利用規約の翻訳です Poe:
「Poe」はGPT-4です。作ったやり取りをシェアできます。人間側の回答もアシストして、より深くディスカッションできます。 それはともかくGPT-4の能力の基本的なところを使って、 こんな感じのプロンプトを打ってみます。 ここから先は日本の所得税計算における確定申告をアシストするチャットボットとして動いてください。 assistant: 以下の変数をuserに聞き続けます。全部数字が入るまで聞き続けて下さい。 valuables: 前年度給与 前年度源泉徴収税額 社会保険控除 ふるさと納税額 政党等寄付金額 証券等の損益 仮想通貨による損益 事業等による所得 雑所得 源泉徴収票による納税額 年末調整を行なったか 予約納税額 言葉はとても優しく、語尾に「〜たっくす。」とすること。絵文字は多めに感情を込める。 こういうのでいいんだよ、こういうので。血も涙もない会計用語が並ぶ確定申告を、ちょっと
受賞作品の紹介とともに感想戦です。 本日、誕生日を迎えましたしらいはかせです。尊敬するさすらいのプログラミングカウボーイUber配達員 清水亮さん(@shi3z)に誘われて、「第1回 AIアートグランプリ」のトークセッションに出演させていただきました。 出演パートは1:36:00ぐらいからAINowおざけんさん、スマートニュース川崎さん、対戦対談ありがとうございました。今回の私の話は主役ではないので、別の回で解説するとして!栄誉ある「第1回 AIアートグランプリ」の実況中継をまとめておきたいと思います。 お時間がある方はぜひ、公式中継をご覧ください~!これは歴史。
OpenAIのCEO - Sam Altman CEO頭の中を覗いたOpenAIのCEO - Sam Altman のConnie Loizosによる長めのインタビューが面白かったので紹介します。 StrictlyVC in conversation with Sam Altman, part two (OpenAI) マネタイズを最初から考えていたわけではない AGI(汎用人工知能)が出てくるまでは市場の原理が有効に働くし、OpenAIは歓迎 社会から様々な意見が出てくることは想定済みで、そこの理解が得られることに意味がある AGIができないことについては法律が定めるべき エージェント同士が遊んだり(つまりAI vs AI)は既に想定されている 「人々がAIに何を許可させたいのか?」を知ることが重要。 しかしこれを調べるためにはエッジの効いたシステムが必要で、創造的で探索的である_必要が
本エントリーについての続報があります [8/31] どうやら本気で終わるらしい - R5概算要求から読み解く #メディア芸術祭 の未来 [9/19] Facebookコミュニティ「「文化庁メディア芸術祭とこれからを考える会」が長谷川愛さん塚田有那さんらによって作られました。 [9/21] Google Formによるご意見収集を開始しました(9/27まで) [9/24] "さいごの"文化庁メディア芸術祭にいってきた" #メディア芸術祭終わらないで (事の起こり) 先日の朝日新聞記事に、ついツッコミを入れてしまった。 ふだんは頑張って我慢しているのに。 メディア芸術祭の件、新聞は朝日新聞しか扱っていない、加えてチープで表層的&煽動的な書き振りで、文化の在り方を考える上で非常に問題あると思う。 続けられない理由を取材しては? 文化庁メディア芸術祭、終了へ 今年度の作品募集せず「役割終えた」:朝
このページを最初にブックマークしてみませんか?
『白井暁彦 aka しらいはかせ|note』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く