Slide 1

Slide 1 text

Mar. 5, 2010 Long-term testing on accelerated Linux kernel Yoshitake Kobayashi Advanced Software Technology Group Corporate Software Engineering Center TOSHIBA CORPORATION Copyright 2010, Toshiba Corporation.

Slide 2

Slide 2 text

2 本日の発表のアウトライン 問題 Linuxカーネルの加速方法 実装と問題点 実験 まとめ

Slide 3

Slide 3 text

3 はじめに 今回 今回 今回 今回の の の の話 話 話 話は は は は・・・ ・・・ ・・・ ・・・ • 「こんなことをやってみた」という内容です 何 何 何 何をしたか をしたか をしたか をしたか • Linux カーネルの動作を加速してみました • ....というのは,少し(かなり?)”怪しい”部分を含みます

Slide 4

Slide 4 text

4 問題と解決案 問題 • 長期稼動を対象としたテストには時間がかかる → 手っ取り早く長期間分のテストをしてみたい START GOAL 加速 加速 加速 加速! ! ! !

Slide 5

Slide 5 text

5 制限事項 加速 加速 加速 加速できないものは できないものは できないものは できないものは多 多 多 多い い い い • CPUの最大動作周波数 • ディスクアクセススピード • ネットワーク通信速度 • ..... 加速 加速 加速 加速できそうなもの できそうなもの できそうなもの できそうなもの • 時間の進み方 ハード ハード ハード ハードそのものは そのものは そのものは そのものは 加速不可 加速不可 加速不可 加速不可

Slide 6

Slide 6 text

6 時間の加速にあたって Linuxにおける における における における時間管理 時間管理 時間管理 時間管理 • jiffies - システム起動時から経過したtick数 • xtime - 現在時刻と日付を保持 加速 加速 加速 加速の の の の定義 定義 定義 定義 • 加速 = jiffies × 加速係数 jiffies jiffies jiffies jiffiesが が が が基本 基本 基本 基本

Slide 7

Slide 7 text

7 実装 1. Kconfigにパラメータを追加 • Config SPEEDUP_RATIO (範囲:1~1000) 2. do_timer()関数でごにょごにょ • 単に加速係数を掛けているだけ 3.操作は procfs経由で行う 例: echo 100 > /proc/sys/kern/accel など 実装環境: kernel-2.6.18 (Debian/GNU Linux 4.0) void do_timer(….) { jiffies_64 = jiffies_64 + (1 * speedup_ratio); ….. } 1000倍速 倍速 倍速 倍速で で で で起動 起動 起動 起動! まともに まともに まともに まともに 動 動 動 動かない かない かない かない!

Slide 8

Slide 8 text

8 動作不具合現象と原因 1. 現象 • ファイルシステムがマウントできない • デバイスがまともに動作しない 2. 原因 • カーネル内部のタイムアウト処理 - デバイスドライバ - ファイルシステム • ユーザレベルプログラムのタイムアウト 例: udev

Slide 9

Slide 9 text

9 具体例 マウスが動かない • 以下のカーネルメッセージが表示される - Mar 4 00:18:13 accel kernel: psmouse.c: Wheel Mouse at isa0060/serio1/input0 lost synchronization, throwing 1 bytes away. - 赤で書いたファイル名は実際には”psmouse-base.c” (コメントのバグ?) キーボード • キーボード入力: 一瞬で数十文字入力が可能に! • シリアルコンソールは大丈夫 スクリーンセーバー • 一瞬でブラックアウト

Slide 10

Slide 10 text

10 タイムアウトへの対策 1. 方針 • 対象カーネルのタイムアウト依存部を整理 • jiffiesを利用している部分を中心にgrepで 2. 方法 • 加速係数に合わせてタイムアウトを調整 • ( timeout * speedup_ratio ) でタイムアウトを長く gnomeデスクトップ デスクトップ デスクトップ デスクトップ環境 環境 環境 環境までそれなりに までそれなりに までそれなりに までそれなりに動 動 動 動いた いた いた いた

Slide 11

Slide 11 text

11 実験 ★ 簡単なテストプログラムをいくつか用意 • gettimeofday()利用による時間進行確認プログラム • times()利用による時間進行確認プログラム • syslog, message, vmstatログ監視プログラム • とりあえず10年程度走らせてみる(1000倍速で約4日) ★ 結果 • gettimeofday()利用では特に問題なし • times()利用ではclock_tオーバーフローを確認 (マニュアルに書かれている通りの動作) • syslog, message, vmstatログ監視では特に異常は見当たらない • ACPIによる電源断も10年経過後も行えるようだ

Slide 12

Slide 12 text

12 スクリーンショット xdaliclockはそれなりの はそれなりの はそれなりの はそれなりの速度 速度 速度 速度で で で で動作 動作 動作 動作 xclockは は は は針 針 針 針がまともに がまともに がまともに がまともに動作 動作 動作 動作せず せず せず せず( ( ( (スキップ スキップ スキップ スキップ動作 動作 動作 動作) ) ) ) 40倍速程度 倍速程度 倍速程度 倍速程度で で で で CPU使用率 使用率 使用率 使用率100% % % %に に に に 450日弱 日弱 日弱 日弱で で で で不正 不正 不正 不正な な な な値 値 値 値が が が が 出力 出力 出力 出力されている されている されている されている

Slide 13

Slide 13 text

13 まとめ Linuxカーネル カーネル カーネル カーネルを を を を加速 加速 加速 加速してみた してみた してみた してみた • 本当に(ハードウェアが)速くなるわけではない - 物理的に加速したのではないので限界あり - 加速したのは時刻のみ • ソフトウェアの実行は”見た目”で早く感じることもある • clock_tのオーバーフロー問題は,1日程度で再現可能 • カーネル自体は10年動作させても大丈夫そう • 長期稼動向けの試験に応用することを期待 • 他の有効利用方法についてはアイデア アイデア アイデア アイデア募集中 募集中 募集中 募集中です

Slide 14

Slide 14 text

14 2008 / 7 / 24 TOSHIBA Confidential