Slide 1

Slide 1 text

ソートアルゴリズム 101 1

Slide 2

Slide 2 text

自己紹介 池田 昭仁 ( いけだ あきひと) @akht_ikd 鹿児島市内でSE( プログラマ...?) 3 年目になりました 趣味 自転車( 最近乗ってない) 野球( ほとんどやってない) 2

Slide 3

Slide 3 text

ソートとは? ソート (sort) は、データの集合を一定の規則に従 って並べること。日本語では整列(せいれつ)と 訳される。(以前はその原義から分類という訳語 が充てられていた)[1] ) 主にコンピュータソフトにおけるリストに表示す るデータに対し、全順序関係によって一列に並べ ることを指す。また、単に「ソート」といった場 合、値の小さい方から大きい方へ順に並べる昇順 (しょうじゅん、ascending order )を指すことが 多い。その反対に値を大きい方から小さい方へ順 に並べることを降順(こうじゅん、descending order )という。 “ 3

Slide 4

Slide 4 text

要するに ソートとは、何かを並べること ソートアルゴリズムとは、 何かを並べるための手順のこと 4

Slide 5

Slide 5 text

ソートが、 できるとうれしいのか? ソートされてると見やすいのでうれしい ソートされていると探しやすいのでうれしい 自分で書けるとうれしいのか? 人による... ? みなさんはうれしいですか? 5

Slide 6

Slide 6 text

ソートアルゴリズムの性能 ( 時間計算量) アルゴリズムの性能評価の指標のひとつ どれくらい時間がかかるか( 効率が良いか) を表してい る ランダウ記法で表す よく出てくるのはこの2つ O(n ) ・・・遅い O(nlogn) ・・・速い (ただしn がとても大きい場合) 2 6

Slide 7

Slide 7 text

7

Slide 8

Slide 8 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート それぞれざっくり紹介していきます 8

Slide 9

Slide 9 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート 9

Slide 10

Slide 10 text

バブルソート 平均計算量: O(n ) 最悪計算量: O(n ) 考え方: 隣り合うふたつの要素の大小を比較し 正しく並ぶように交換する 考え方も実装もシンプルでわかりやすい しかし遅い 2 2 10

Slide 11

Slide 11 text

バブルソート 動き 5 3 1 2 4 という配列を昇順に整列させる 1. まず先頭から2つに着目し、並べる 5 と3 は順序が逆転しているので入れ替える この時点で3 5 1 2 4 になる 2. その次の2つに着目し、並べる 5 と1 は順序が逆転しているので入れ替える この時点で3 1 5 2 4 になる 3. 同様に繰り返す 11

Slide 12

Slide 12 text

12

Slide 13

Slide 13 text

バブルソート 計算量 一回のスキャンでひとつずつ位置が確定していく つまり要素数がn 個のとき、 最初はn − 1 回の比較(最大値の位置が確定) 次はn − 2 回の比較(次に大きい値の位置が確定) ・・・ 最後の1 回の比較(全ての並びが確定) となるので、 比較回数は1 + 2 + ... + (n − 1)= 回になる よって計算量は O(n ) ということになる ※最大次数の項だけ残す 2 n(n−1) 2 13

Slide 14

Slide 14 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート 14

Slide 15

Slide 15 text

挿入ソート 平均計算量: O(n ) 最悪計算量: O(n ) 考え方: 前から順番にみていって、適切な位置に挿入する 考え方も実装もシンプルでわかりやすい しかし遅い 2 2 15

Slide 16

Slide 16 text

挿入ソート 考え方 2 つめの要素から最後まで走査する 着目している要素をP とする P より前の位置にある要素を見ていき P より大きければそれを後ろにずらす P 以下の要素が見つかるまで走査し ずらしていって出来た隙間に挿入する 16

Slide 17

Slide 17 text

挿入ソート 動き 2 9 7 4 を昇順に整列させる 1. 2つ目の9 を選んで、それより前の要素を比べる 大きいものはないので次の要素に移る2 9 7 4 2. 7 を選んで、それより前の要素と比べる(7 はp とし て覚えておく) 9 は7 より大きいのでひとつずらす2 _ 9 4 2 は7 より小さいのでここで走査は終了。空いた 場所に7 を入れる2 7 9 4 3. 同様に繰り返す 17

Slide 18

Slide 18 text

18

Slide 19

Slide 19 text

挿入ソート 計算量 各要素について自分より前の要素と比較していく 1 つ目の要素は1 回の比較、その次は2 回の比較... とな っていく( 最悪時) 平均するとその半分なので、 + + + ... + = になる よって計算量は O(n ) ということになる 2 1 2 2 2 3 2 n−1 4 n(n−1) 2 19

Slide 20

Slide 20 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート 20

Slide 21

Slide 21 text

マージソート 平均計算量: O(nlogn) 最悪計算量: O(nlogn) 考え方: 対象を細かく分割してソートし、それらをマージする 分割統治法によるアルゴリズム 速い 21

Slide 22

Slide 22 text

マージソート 考え方 1. 対象を真ん中で2つに分割する 2. それぞれを何らかの方法でソートする 3. 分割された2つをマージする では、 2( ソート) と3( マージ) をどうやるか? 22

Slide 23

Slide 23 text

マージソート 考え方 ソートをどうするか? 前ページで示した手順を行う関数 mergesort() を 再帰的に呼び出す マージ処理の手順 ソート済みの配列A, B をマージして配列C を作るとき 「A, B のそれぞれ先頭の要素を比べて小さい方をC の 末尾に追加する」という手順を繰り返す 23

Slide 24

Slide 24 text

24

Slide 25

Slide 25 text

マージソート 計算量 ※ざっくり 分割とマージにはそれぞれO(logn) かかる 分割は4 -> 2 -> 1 と毎回半分になり マージは1 -> 2 -> 4 と毎回2 倍になるため 各マージにはそれぞれO(n) かかる よって全体ではO(nlogn) かかることになる 25

Slide 26

Slide 26 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート 26

Slide 27

Slide 27 text

ヒープソート 平均計算量: O(nlogn) 最悪計算量: O(nlogn) 考え方: ヒープ構造を利用してソートする 速い 27

Slide 28

Slide 28 text

ヒープソート 考え方 1. ヒープを作る 2. ヒープのルートノードを取り出し 結果の先頭に加える 3. ヒープを再構築する 4. ヒープが空になるまで繰り返す 28

Slide 29

Slide 29 text

29

Slide 30

Slide 30 text

30

Slide 31

Slide 31 text

31

Slide 32

Slide 32 text

32

Slide 33

Slide 33 text

33

Slide 34

Slide 34 text

34

Slide 35

Slide 35 text

35

Slide 36

Slide 36 text

36

Slide 37

Slide 37 text

37

Slide 38

Slide 38 text

38

Slide 39

Slide 39 text

ヒープソート 計算量 ※ざっくり ヒープを構築 O(logn) をn 回行うのでO(nlogn) ヒープから最大値を取り出して再構築 O(logn) をn 回行うのでO(nlogn) よって全体でもO(nlogn) ということになる 39

Slide 40

Slide 40 text

代表的なソートアルゴリズム バブルソート 挿入ソート マージソート ヒープソート クイックソート 40

Slide 41

Slide 41 text

クイックソート 平均計算量: O(nlogn) 最悪計算量: O(n ) 考え方: 軸( ピボット) を選びそれより小さいものと大きいもの にわける わかれた2つに対して再帰的に同じことを繰り返す 分割統治法によるアルゴリズム 実用上もっとも高速といわれる 2 41

Slide 42

Slide 42 text

クイックソート 考え方 1. ピボット( 基準値) を選ぶ 2. ピボットで入力データを2つに分ける ピボットより小さいものを前半に持っていく ピボットより大きいものを後半に持っていく 3. 2つの列を再帰的にソートする 4. 部分列をソートし終わると自動的に全体のソート も完了している 42

Slide 43

Slide 43 text

43

Slide 44

Slide 44 text

クイックソート 実装 2つに分割する処理の実装方法としては以下のような ものがある 左から順に値を調べ、ピボットより大きいなもの を見つける(i 位置) 右から順に値を調べ、ピボットより小さなものを 見つける(j 位置) i <= j なら、その2つの値を交換する i+1 、j-1( それぞれひとつ進めた位置) から再び値を 調べていく i とj がクロスしたら、i の左側を境界として分割する 44

Slide 45

Slide 45 text

クイックソート 計算量 ※ざっくり 元のデータを全て分割するのにO(logn) ピボットを境にして要素をswap するのにO(n) よって全体ではO(nlogn) かかることになる しかし、例えばピボットによる分割が 常に片方0 、片方すべてと偏った場合はO(n ) になる ( 最悪ケース) 2 45

Slide 46

Slide 46 text

クイックソート 工夫 ピボット選びを工夫することで 最悪ケースの問題を抑えることができる たとえば 真ん中の位置の値を使う 先頭・中央・末尾の中間値を使う また、ソートを行う前に適当にシャッフルするなどの 方法もある 46

Slide 47

Slide 47 text

ハイブリッドなソート 複数のアルゴリズムを組み合わせて 弱点を補ったり改良を加えたものもある ( 標準ライブラリなどにはそういうものが使われてい る) Intro Sort クイックソート + ヒープソート Tim Sort マージソート + 挿入ソート 47

Slide 48

Slide 48 text

ご静聴ありがとうございました 48