Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LLVMのコード自動生成機構におけるコード記述を支援するツールの作成

Arata
January 16, 2024
35

 LLVMのコード自動生成機構におけるコード記述を支援するツールの作成

Arata

January 16, 2024
Tweet

Transcript

  1. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 背景 / コンパイラの基本構成 2

    フロントエンド ソースコードを パース・解析 バックエンド CPUが実行可能な 機械語を出力 コンパイラ ソースコード 機械語
  2. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 背景 / LLVM: コンパイラを作るためのライブラリ

    • コンパイラを作るたびにバックエンドを作るのは難しい ◦ 世界では数多の種類のCPUが使われているため ◦ そこでバックエンドの実装として使えるLLVMが誕生した • C(Clang), C++(Clang), Rust, Swift, Juliaなどで使われ ている 3
  3. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • LLVMはCPUの情報を記述するためにTableGenを使う ◦ CPUの{レジスタ,

    機能, 命令}など ◦ CPUに合わせて機械語を出力するために必要となる 背景 / TableGen: LLVMのコード自動生成機構(DSL) 4 例: TableGenでx86-64のレジスタを記述
  4. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • TableGenを書く際にエディタの支援を受けられない ◦ エラーの表示、入力補完、シンタックスハイライトなど

    • 現在、約57万行のTableGenコードがLLVM内に存在する ◦ 57万行のプログラムをメモ帳で書くのと同じような状況 目指すこと: エディタの支援を受けながらTableGenのコードを 快適に書きたい 課題 / TableGenの開発環境が快適ではない 5
  5. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • エディタ支援を実装する方法として言語サーバがある ◦ Microsoftが発表したLanguage

    Server Protocol(LSP)を 実装するサーバ • LSPに対応したエディタならば言語サーバの機能を使うこ とができる ◦ Vim, Emacs, VSCodeなどが対応している 方針 / TableGenの言語サーバを作る 6
  6. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • RustでTableGenの言語サーバを実装し、GitHubと Marketplaceで成果物を公開した ◦

    https://github.com/arata-nvm/tablegen-lsp • 工夫した点(詳細は省略) ◦ Red-Green Treeを使用しているため、不完全なソースコードを 扱うことができる ◦ ソースコードのパース結果や解析結果をキャッシュしているた め、余分な処理をスキップできる ◦ パーサを言語サーバと分離しているため、別のプロジェクトで再 利用できる 実装 7
  7. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • デモのためにVSCode向けの拡張機能を作成した • 実装した以下の機能について、おおまかな使用例を紹介

    する ◦ エラーの表示 ◦ シンタックスハイライト ◦ 定義へ移動 / 参照へ移動 ◦ ホバー時のドキュメント表示 ◦ 入力補完 ◦ インレイヒント 使用例 8
  8. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • TableGenのすべての構文を処理できるようにする ◦ 現在は対応していない一部の構文を無視している

    • 使い勝手を改善する ◦ 補完候補が表示される順番の最適化、型チェックなど • 言語サーバーのWASM化 ◦ 現在はプラットフォームごとのバイナリをバンドルしている 今後の展望 15
  9. 2024/01/16 | LLVMのコード自動生成機構におけるコード記述を支援するツールの作成 | 安藤 慎 • LLVMではマシンの情報を記述するためにTableGen言語 が使われている •

    TableGenをエディターで書きやすくするために言語サー バをRustで実装した • メモ帳でプログラミングをする必要がなくなった まとめ 16