Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
今年は、『浅草』、『川越』、 そして【名古屋】です!
Search
Masahiko Hashimoto
March 02, 2024
Technology
0
430
今年は、『浅草』、『川越』、 そして【名古屋】です!
OSC2024 Online/Spring のLTでお話したスライドです。
Masahiko Hashimoto
March 02, 2024
Tweet
Share
More Decks by Masahiko Hashimoto
See All by Masahiko Hashimoto
LLM時代のかな漢字変換のつくりかた
hashimom
0
180
Other Decks in Technology
See All in Technology
AI連携の新常識! 話題のMCPをはじめて学ぶ!
makoakiba
0
180
InsightX 会社説明資料/ Company deck
insightx
0
180
日本のソブリンAIを支えるエヌビディアの生成AIエコシステム
acceleratedmu3n
0
110
新米エンジニアをTech Leadに任命する ー 成長を支える挑戦的な人と組織のマネジメント
naopr
1
340
dbtとAIエージェントを組み合わせて見えたデータ調査の新しい形
10xinc
7
1.7k
OpenCensusと歩んだ7年間
bgpat
0
310
Amazon Q Developer CLIをClaude Codeから使うためのベストプラクティスを考えてみた
dar_kuma_san
0
310
実践マルチモーダル検索!
shibuiwilliam
3
530
知覚とデザイン
rinchoku
1
720
プロファイルとAIエージェントによる効率的なデバッグ / Effective debugging with profiler and AI assistant
ymotongpoo
1
730
Open Table Format (OTF) が必要になった背景とその機能 (2025.10.28)
simosako
3
600
ViteとTypeScriptのProject Referencesで 大規模モノレポのUIカタログのリリースサイクルを高速化する
shuta13
3
250
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
5.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
2.9k
The Cost Of JavaScript in 2023
addyosmani
55
9.1k
Statistics for Hackers
jakevdp
799
220k
Done Done
chrislema
186
16k
Embracing the Ebb and Flow
colly
88
4.9k
Git: the NoSQL Database
bkeepers
PRO
431
66k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
We Have a Design System, Now What?
morganepeng
54
7.9k
Music & Morning Musume
bryan
46
6.9k
A better future with KSS
kneath
239
18k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Transcript
今年は、『浅草』、『川越』、 そして【名古屋】です! OSC 2024 Online/Spring はしもとまさひこ
2/ Who am I ? Name: はしもとまさ(または鹿) Twitter: @shikanotsukimi •東海道らぐ (Tokaido Linux
Uesr Gruop) …の関東案内人 •おーぷん万葉プロジェクト オープンデータを使用したかな漢字変換の自作など •ちびぎーこ保護者会(別名:日本openSUSEユーザ会) およそ雑用です!
最近書いてる小説について 『エーデルシュティメ』 カメレオンみたいな何かに脅される 高校生たちの日記的なにか 『セピア色の傘立て』 【推し◦子】に触発されて 書き始めてるなにか https://cafe.shikanotsuki.me/ 「しかつきかふぇ」で検索!
Attention! つい数時間前に告知内容を募集したら いろいろ出てきてしまったので とっとと行きます!!
【告知①】 openSUSE Asia Summit を 今年は日本でやるよりたいよ! 注: 2009年10月のOSC東京の写真らしい(何年前だよ… そもそも皆さん openSUSE
って ご存知ですか?
openSUSE Asia Summit とは openSUSEのアジア圏のユーザーが一堂に会するイベント! • 前回の日本開催は 2017年 • そろそろ日本でもやりたいね〜という声が増えてきたらしい
• とりあえず現在はプロポーザルを書いてます 現在協力していただける方、大募集中!! (小江戸らぐの懇親会などで打ち合わせ中??)
【告知②】 来週はOSC浅草!!! 正式名称 『Open Source Conference 2024 Tokyo/Spring』 日時: 2024年3月10日(日) 10:00~16:00 場所: 東京都立産業貿易センター台東館 7階
自作かな漢字変換『ANYA』も展示します! ※おーぷん万葉ブースにて
【ANYAの変換の仕組み】次単語生成予測 現在の単語 Z 次の単語(予測) エンコード デコード 入力 出力 現在の単語を入力として 次の単語を生成できるように
学習する ※専門的にいうと VAE 的なもの(※AEだけど!) →最もベクトルの形が 似ているものを選択
そんなANYAの課題・・・ 現在の単語 Z 次の単語(予測) ここに入力する値について改修中 ※分散表現と呼ばれてる部分 現在 fasttext というのを使用している float型の羅列であって
これが辞書サイズを大きくしてしまう原因
そんなANYAに頼もしい味方になりそうなものが!? BitNet ※今週のLLM界隈で最も(?)盛り上がったネタ https://arxiv.org/pdf/2402.17764.pdf 従来の分散表現: ひとつの単語を float型の羅列で現 していた BitNet: 1, 0,
-1 と ビット(?)で表現が できる つまりこのBitNetを2進数の値とみなせば 圧倒的に辞書ファイルサイズが圧縮できるのでは!?
が、しかし! 問題が!!! いやこれ1ビットじゃねーし!! 1.58bitってなんだよ!?? -1 とか2進数で表せないじゃん!! 今後の BitNet の発展に期待・・・ ・・・しつつ、並行でANYAの辞書ファイル改善は継続中orz
【告知③】 4月はOSUNC川越!!! 春の川越で、ビールを飲みながらライトニングトーク大会! 東海道らぐの兄貴分、 小江戸らぐメンバーと LT大会を楽しもう!! 日時: 2024/4/20(土) 13:00 〜 17:00
場所: 東上パールビルヂング地下 第一ホール https://connpass.com/event/310831/ ・・・オフライン実施何年ぶりだっけか???
以上ここまでおまけでした! 次からが本題です!!(ぇ
【告知④】 江戸(浅草&川越) の次はOSC名古屋ダヨ! 日時: 2024/5/25(土) 10:00〜18:00 場所: 中小企業振興会館 3階 第2ファッション展示場
去年に引き続きオフライン開催 & 名古屋では久しぶりの現地セミナーあり!! 現在絶賛(?)準備中 ですよ! (OSC名古屋のリリーちゃん)
今年も例のよってポスター制作中 案がいろいろ出てきた件・・・
そして困ったしまださん →それならAIに助けてもらいましょう!!(ぇ
試しにお手元のStableDiffusionにデッサンさせてみた 試してみたプロンプト: 「ロボットに変形する名古屋城の前で追いかけっ子をする自動走行する金 の鯱と女の子」 これを英語に変換するとこんな感じ “A self-driving Golden Shachi and
a girl chase each other in front of Nagoya Castle, which transforms into a robot.” →いくつか出力させたけどその中から3枚を抽出!
1枚め 違う、 そういうことではない!
2枚め 金の鯱とは・・・?
3枚め そう、これだよこれ!! (なにが?)
というわけで今年のOSC名古屋も 引き続きヨロシクオネガイシマス しまださんよりお断り: 実際にデザインをお願いするのは AIではなく人間ですので その点はお間違いなきようお願いします。