Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自作言語のすすめ - シン・プログラミング自作版 -
Search
soukouki
August 22, 2021
Technology
490
0
Share
自作言語のすすめ - シン・プログラミング自作版 -
インタプリタの内部実装の紹介と、自作言語yokanの紹介です。
soukouki
August 22, 2021
More Decks by soukouki
See All by soukouki
ローカルLLMバイブコーディングのすすめ
soukouki
0
4
ゲーム画面をブラウザから見られるサイトを作った話
soukouki
0
71
Simutrans CityView (日本語版)
soukouki
0
110
Simutrans CityView (English)
soukouki
0
71
10分で学ぶ すてきなモナド
soukouki
1
180
Misskey自鯖を建ててみた
soukouki
1
98
1年前の日記を要約するツールをローカルLLM&自作MCPサーバーで作った話
soukouki
0
500
自作Cコンパイラ 8時間の奮闘
soukouki
0
1.9k
定理証明支援系Coq(セキュリティキャンプLT会)
soukouki
1
270
Other Decks in Technology
See All in Technology
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
100k
オライリーイベント登壇資料「鉄リサイクル・産廃業界におけるAI技術実応用のカタチ」
takarasawa_
0
350
毎日の作業を Claude Code 経由にしたら、 ノウハウがコードになった
kossykinto
1
1.1k
AI駆動開発で生産性を追いかけたら、行き着いたのは品質とシフトレフトだった
littlehands
0
460
CyberAgent YJC Connect
shimaf4979
1
170
会社説明資料|株式会社ギークプラス ソフトウェア事業部
geekplus_tech
0
200
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
940
Agent の「自由」と「安全」〜未来に向けて今できること〜
katayan
0
350
巨大プラットフォームを進化させる「第3のROI」
recruitengineers
PRO
2
2.5k
カオナビに Suspenseを導入するまで / The Road to Suspense at kaonavi
kaonavi
1
440
サンプリングは「作る」のか「使う」のか? 分散トレースのコストと運用を両立する実践的戦略 / Why you need the tail sampling and why you don't want it
ymotongpoo
3
130
Agents CLI と Gemini Enterprise Agent Platform で マルチエージェント開発が楽しくなる!
kaz1437
0
260
Featured
See All Featured
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
Ethics towards AI in product and experience design
skipperchong
2
270
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
690
How to Build an AI Search Optimization Roadmap - Criteria and Steps to Take #SEOIRL
aleyda
1
2k
Design in an AI World
tapps
1
210
Ruling the World: When Life Gets Gamed
codingconduct
0
220
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
370
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
New Earth Scene 8
popppiees
3
2.2k
Thoughts on Productivity
jonyablonski
76
5.1k
Transcript
自作言語のすすめ シン・プログラミング自作版
自己紹介 29期生で学部1年の sou7 / soukouki です。 twitter:@sou7___ (アンダーバーは3つ!) discord:sou7#0094 github:soukouki
atcoder:soukouki 大学入ってからというもの、周りにすごい人が多くて刺 激されてます。 みんなすごい!
かわいい!
すごいかわいい!
自己紹介(おまけ) Goはyokanを実装するまで 未経験でした。未経験言語 で実装するのは大変。 保有資格 ->
えっ?
自作〇〇、といえば? 自作PC 自作OS そのなかでもやっぱり! 自作言語 もうこれ以外ない!(強制)
インタプリタとコンパイラ 言語の処理系を作るには、大まかに インタプリタ コンパイラ に別れます。 コンパイラよりもインタプリタのほうが実装が簡単(構文木を使って実行するだけで済 む)ので、今回はインタプリタを実装しました。
インタプリタの構造 インタプリタは、概ね次の3段階の処理に別れます。 字句解析 ソースコード(文字列)をトークン(後ほど説明します)の列に切り分ける処理 構文解析 トークンの列を木構造の抽象構文木(これも説明します)に解釈する処理 評価 抽象構文木を使ってプログラムを実行する処理 これらの処理の実装方法などについても触れていきます。 余談ですが、実行速度が重要なインタプリタ(RubyやNode.jsなど)は更に何段階かに分
かれているそうです。
トークンとはなんぞや トークンとは、一言で言えばコード上で意味を持つ最小単位の文字の並びです。 具体的にはこんなものです。 予約語 (C言語でいう if とか const とか。yokan言語には予約語はありません。) リテラル
( 123 , "str" のような、プログラム上の数値や文字列) 識別子 (関数名や変数名のような、プログラム上で自由に名前をつけられるもの) 演算子 ( == , < , + ) 括弧 デミリタ (カンマとか)
抽象構文木とはなんぞや 抽象構文木とは、コードの構造を木構造で表したものです。 今回はGoの構造体を組み合わせて表現しました。 具体例 1+2*3 は字句解析で 1 + 2 *
3 のような列になり、さらに構文解析で Add(1, Mul(2, 3)) このような形になります。
字句解析 字句解析とは、ソースコードの文字列から、トークンの列に変換する処理です。 yokan言語では、その文字と、その次の文字を見ることでトークンを区別できるように なっています。( = と == を考えてみると良いでしょう) たいてい、コメントはこの段階で除去されます。(yokanにコメントはありません が・・・)
実装はそこまで難しくなく、数時間程度で作れます。
構文解析 構文解析とは、字句解析で得られたトークンの列から、抽象構文木に変換する処理で す。 この構文解析には幾つもアルゴリズムがあります。今回はその中から再帰下降構文解 析という、比較的素朴な方法を使いました。 ちなみに、構文解析を高速に行うにはもっと複雑な構文解析のアルゴリズムを使うこ とが多いのですが、そのコードはとても複雑になり人には書けないため、ソースコー ドを生成するコンパイラ(パーサジェネレータ、コンパイラコンパイラとも)を使うこと が多いです。
再帰下降構文解析 再帰下降構文解析は、相互再帰(複数の関数を組み合わせて作る再帰)で構成される構文 解析のアルゴリズムです。 アルゴリズムを構成する関数(または処理のまとまり)と、解析する言語の文法が1対1に 対応するため、簡単に実装できます。
具体例 Wikipedia「再帰下降構文解析」より引用 void term(void) { factor(); while (sym == times
|| sym == slash) { getsym(); factor(); } } void expression(void) { if (sym == plus || sym == minus) getsym(); term(); while (sym == plus || sym == minus) { getsym(); term(); } } (yokanではもう少しごちゃごちゃした処理を書いています。)
構文木を使った評価 インタプリタなどでは、プログラムを実行することを「評価する」と言うことが多い です。 yokan言語では、構文解析で得られた構文木を使って、直接評価しています。 func evalMinusPrefixOperatorExpression(right object.Object) object.Object { //
型チェック err, ok := checkTypeIsInteger("MinuPrefixOperator", right) if !ok { return err } // 内部の整数を取得 value := right.(*object.Integer).Value // マイナス演算子を適用 return &object.Integer{Value: -value} }
yokan言語の推しポイント yokan言語では無名関数は '(' <カンマ区切りの引数リスト> ')' '{' <文> '}' というかなりシンプルな構文を使います。これによって if(
cond, (){puts(true)}, (){puts(false)} )() という形で、if関数 を使って条件分岐を実装できます。
yokan言語について リポジトリはこちらです。 プルリクエスト歓迎してます! https://github.com/soukouki/yokan
参考になる本 「Go言語でつくるインタプリタ」 https://www.oreilly.co.jp/books/9784 873118222/ 基本的な構造はこの本と同じです。 ただ、構文が違ったり、構文解析の アルゴリズムが違ったりと、自分で アレンジした箇所も多くあります。
ありがとうございました!