極小頂点被覆列挙問題を解く

1/30 極小頂点被覆列挙問題を解く @kaityo256

2/30 数独と頂点被覆列挙問題 (1/4) 数独ナンプレとも (「数独」はニコリの登録商標) ヒントを頼りに1から9の数字を埋めるペンシルパズル行、列、ボックスごとに1から9までの数字をひとつずつ入れるルール：

3/30 数独と頂点被覆列挙問題 (2/4) 16ヒントの数独で解が一意になるものは存在しない There is no 16-Clue Sudoku [arXiv:1201.0749]
数独の16ヒント定理証明方法・数独の「答え」は有限個(自明な変換を除いて5,472,730,538個) ・それぞれの答えについて16ヒント問題を作る・その全てについて解が一意でないことを示す極小頂点被覆列挙問題スパコンを使っても16ヒント問題を全て尽くすのは不可能解が一意になる可能性がある問題を効率的に列挙したい (いわゆる「エレファントな証明」)

4/30 最小頂点被覆問題(1/3) 学校の開校問題国語、算数、理科、社会、英語の五教科を教える学校を開校したい教師候補は以下の五人教師名担当可能科目給料(コスト) Alice 理科
2 Bob 国語、社会 5 Carol 理科、社会、英語 10 Dave 国語、算数 6 Eve 算数、英語 8 教師候補を何人か雇って、五教科全てを教えられるようにしたいただし、給料の総和は最小化したい

5/30 最小頂点被覆問題(2/3) 解法の方針コストは考えず、以下の条件を満たす教師の組み合わせを全列挙・五教科全てを教えられる (被覆性) ・一人でも欠けたら五教科を教えられなくなる (極小性)
上記の組み合わせそれぞれについてコストを計算し、最小のものを探す → 極小頂点被覆列挙問題 → 最小頂点被覆列挙問題

6/30 最小頂点被覆問題(3/3) Alice Bob Carol Dave Eve 国語算数理科
社会英語 Carol + Dave = 16 Bob + Carol + Eve = 23 Alice + Bob + Eve = 15 これが求める答え極小頂点被覆これを列挙したい

7/30 頂点被覆問題のグラフ表現 (1/2) Alice Bob Carol Dave Eve A B
C D E Bob Carol Dave Eve Alice C A B E D 教師: 頂点(Vertex) 科目: 辺(Edge) グラフに書き直すことができる A: 国語 B: 数学 C: 理科 D: 社会 E: 英語

8/30 頂点被覆問題のグラフ表現 (2/2) Bob Carol Dave Eve Alice C A
B E D Bob Carol Dave Eve Alice C A B E D Bob Carol Dave Eve Alice C A B E D 頂点被覆全ての辺が選ばれた頂点のいずれかに所属するような頂点集合極小頂点被覆どの頂点が欠けても頂点被覆でなくなるような頂点集合

9/30 ヒッティングセット Simple Graph Hyper Graph Vertices Edges Vertices Hyper
Edges 辺は必ず二点を繋ぐ三点以上をつなぐ辺が存在ヒッティングセットグラフにおける頂点被覆問題の拡張

10/30 頂点被覆列挙のビット表現 (1/3) 00100100 00011000 00010001 00110000 10000010 00000101 00010010
00100001 00001001 87654321 グラフのビット表現 ≠ Adjacency matrix 各ビット列は辺を表現その辺につながる頂点のビットが立っている

11/30 頂点被覆列挙のビット表現 (2/3) 00100100 00011000 00010001 00110000 10000010 00000101 00010010
00100001 00001001 頂点被覆のビット表現 87654321 00010111 87654321 00010111 頂点被覆の条件 → 全ての辺のビット列と論理積(AND)をとってゼロではない極小性の条件 → ひとつでもビットがかけたら頂点被覆でなくなる

12/30 頂点被覆列挙のビット表現 (3/3) 極小頂点被覆列挙とは 00100100 00011000 00010001 00110000 10000010 00000101
00010010 00100001 00001001 00010111 00111110 10010101 10111100 00101011 00110011 10110001 グラフ Minimal Hitting Sets このビット列を入力としこのビット列を出力する問題典型的なNP完全問題ビット表現

13/30 ナイーブな実装 (1/2) 1 2 3 011 110 000 001
010 101 011 010 ・入力のビット列をひとつずつチェック・現在の状態と重なりがないビット列が出現したら、ビットのひとつを立てて再帰入力グラフビット表現 1. 000からスタート 2. 000は011と重なりがない 3. 001を立てて次へ 4. 001と110は重なりがない 5. 110のうち、010を立てて次へ 6. 得られた011は極小でない 1 2 3 4 011 110 5 6 極小でない解や、重複解が出現してしまう極小でない

14/30 ナイーブな実装 (2/2) 1 2 3 101 011 110 000
100 001 110 101 001 101 011 101 011 110 101 110 左の入力からナイーブな再帰をすると出力が重複する重複

15/30 逆探索アルゴリズム(1/4) 極小頂点被覆列挙をナイーブな再帰で実装すると・極小でないものが出現・重複する解が出現これを解決するのが「逆探索アルゴリズム」逆探索の考え方 1.
解に階層を導入する 2. 異なる解に属す解に「親子関係」を定義する・ある子ノードの親は一意に決まるように定める・自分自身が祖先に出現しないようにする 3. 階層を上に行くと答えが単純になり、自明な解が根(root)になるようにする 4. 根から親子木を逆にたどると答えを得る親子関係が木になる参考：宇野毅明：極小集合被覆を列挙する実用的高速アルゴリズム http://id.nii.ac.jp/1001/00031992

16/30 逆探索アルゴリズム(2/4) 部分被覆・入力のビット列がn個とする・その1つ目からk個目までの部分集合を考える・そのk個のビット列に対して極小頂点被覆であるものを k-極小頂点被覆(Minimal Hitting Set, MHS)と呼ぶ
・0-MHSからひとつずつ対応ビット列を増やして行く・n-MHSが求める答え = {1 , 2 ,…, } 入力(辺)全体の集合 = {1 , 2 ,…, } 入力の部分集合 k-HS: k 頂点被覆 k-MHS: k 極小頂点被覆についての頂点被覆についての極小頂点被覆

17/30 逆探索アルゴリズム (3/4) いま、tがk-MHSであるとする時、tの親を生成する操作R(t)を以下で定める R(t) = t ^ (t
& e[k]) Reduction操作 t tが(k-1)-MHSの場合そうでない場合(※) tは(k-1)-MHSではないので、あるビットを削っても、はカバーできるｔからビットを削って(k-1)-MHSにしたものをR(t)とする tはk-MHSであったから、ビットを削ったR(t)はk-MHSではない R(t)はk-MHSではないので、e[k]と交わりを持たせるにはビットを追加する必要があるが、追加は1ビットで十分であるしたがって、tとR(t)の違いは1ビットであり、それはt&e[k]で求められる以上からR(t) = t ^ (t & e[k])となる k-MHSの親が(k-1)-MHSとなるように定めるあるノードの親を作る操作をReductionと呼ぶ −1 ※ tが(k-1)-MHSでないときのR(t)の求め方

18/30 逆探索アルゴリズム(4/4) 頂点被覆における親子木の例 000 100 001 110 001 101 011
110 Reduction 自明な解レベル0 レベル1 レベル2 レベル3 欲しい解 Enumeration 親子各レベルkではk-MHSが列挙されている

19/30 逆探索アルゴリズムの実装 (1/2) 1 2 3 011 110 000 001
010 101 011 010 011 110 k-MHSの子供は必ず(k+1)-MHSでなければならない → 再帰してビットを追加したときに極小でなければ枝刈り極小被覆でない解が取り除かれた枝刈り

20/30 逆探索アルゴリズムの実装 (2/2) 1 2 3 101 011 110 000
100 001 110 101 001 101 011 101 011 110 101 110 0-MHS 1-MHS 2-MHS 3-MHS k-MHSの子供は必ず(k+1)-MHSでなければならない重複解が取り除かれた 2-MHSではない枝刈り

21/30 極小性判定(1/6) 1. tから1-bit取り除いてみる 2. E_k 全てと重なりチェック 3. 全てのビットについて1.2.を繰り返す 4.
1-bit削除したものがE_k全てと重なりを持てば極小でない再帰してビットを追加したとき、極小性を満たさない場合は枝刈りする → t が k-MHSであるかチェックする必要がある(極小性判定) tに含まれるbit数がBの時、計算量はO(kB) bool check_minimal(mybit t, int k, mybits &e) { mybit v = t; while (v) { mybit t2 = v & -v;mybit t3 = t ^ t2; bool flag = true; for (int i = 0; i < k; i++) { flag &= ((e[i] & t3) != 0);if(!flag)break; } if (flag) return false; v = v ^ t2; } return true; } ナイーブな実装

22/30 極小性判定(2/6) Critical Hyperedge もしk-MHSのあるビットを削除した時に、ある辺との重なりがなくなったら、その辺をそのビットのCritical hyperedge (CH)と呼ぶ 101 011
110 Hypeedges 101 101 110 011 MHS Critical Hypeｒedge of this bit Critical Hyperedge of this bit tが極小頂点被覆であるなら、どのビットを削ってもカバーできない辺が出現する → tの全てのビットに最低ひとつはCHが存在する

23/30 極小性判定(3/6) 00010010 01100110 10110100 11011000 01000111 01010011 01100110 01010010
01100110 10110100 11011000 01000111 01010011 01100110 minimal not-minimal 極小性条件 tを構成する全てのビットが、最低一つのCHを持つ時に限り、t はMHSとなる critical hyperedgeを持たないbitを持つ場合、極小ではない

24/30 極小性判定(4/6) 極小性条件判定 tを構成する全てのビットが最低一つの(CH)を持つ CHを持つビットにフラグを立てていく tを構成する全てのビットにフラグが立てばtは極小であるビット演算による実装 1. tと辺の論理積をとり、たっているビット数の数を数える 2.
もし1ビットならその辺はCHであるので、そのビット位置を覚えておく 3. CHとtの重なりビット全ての論理和(OR)をとり、それをt’とする 4. もしt’==tなら、全てのビットがCHを持つのであるからtは極小である 5. そうでないならtは極小ではない

25/30 極小性判定(5/6) 00010010 01100110 10110100 11011000 01000111 01010011 01100110 00000010
00010000 00010000 00000010 00000010 00010010 = 01010010 01100110 10110100 11011000 01000111 01010011 01100110 00000010 00010000 00010000 00000010 00000010 00010010 ≠ 極小性チェック 1. tと辺の論理積(AND)をとったとき、たっているビット数が1ビットな 2. その辺全ての論理和(OR)をとる 3. 結果がtに等しいとき、tは極小である計算量がO(Bk)からO(k)に落ちる t’ t

26/30 極小性判定(6/6) bool check_minimal2(mybit t, int k, mybits &e) {
mybit t2 = 0; for (int i = 0; i < k; i++) { if (popcnt(t & e[i]) == 1) { t2 = t2 | (t & e[i]); } } return (t2 == t); } bool check_minimal(mybit t, int k, mybits &e) { mybit v = t; while (v) { mybit t2 = v & -v;mybit t3 = t ^ t2; bool flag = true; for (int i = 0; i < k; i++) { flag &= ((e[i] & t3) != 0);if(!flag)break; } if (flag) return false; v = v ^ t2; } return true; } 最初の実装改良された実装 tと1ビット重なりを持つe[i]全ての論理和がtに一致するか調べる tから1ビット削ってみて、極小性条件を満たすか調べる

27/30 実行時間入力データ 32-bitのうち、ランダムに10bit 立っている 200行全部でMHSは1352805個存在するこれを列挙するのにかかった時間を計測 01010000100001111000000100001100 01000010010010010101010001000010
10000000100100000100010011001011 01111010001000010000000101000010 00001110010010000100000100001110 10000100010001000010001011110000 10000010001010101011000000100010 10100100100111100010000000100000 ... 結果 Naïve way: Improved way: 3.621 [s] 2.396 [s] ちょっとだけ早くなった

28/30 UA sets (size 4) 不可避集合 (Unavoidable Sets, UA) UA
sets (size 6) もし不可避集合に属すヒントを全て取り除いた場合、解が一意でなくなる集合 000000000000000000000000000000000000101000000000000000000000000000000000101000000 000000000000000000110000000000000000000000000000000000000000000000000000110000000 ... 100001001010001001000000000110000000000000000110000000110000000110000000000000000 100000001011000001010000100010000100001000001000000000111000000000000000000000000 000000001000001110001010110001001001010000100100100000001001001010010000100100000 UA sets Solution 解は必ず全ての不可避集合のビットと重なりを持つ (必要条件) 数独と頂点被覆列挙問題 (3/4) 5と9を入れ替えても数独として成立 → この4つを全て抜くと解が2つ出現

29/30 数独と頂点被覆列挙問題 (4/4) 不可避集合の活用数独の解の一意性判定はコストが高い不可避集合は、「答え」を与えると一意に決まる全ての解は不可避集合と重なりを持っている不可避集合を「解の一意性判定」の前処理に用いる不可避集合と解候補解が一意である場合、必ず全ての不可避集合と重なりを持つ
不可避集合から、解の候補を列挙する極小頂点被覆列挙 16ヒント定理証明の手続き 1. 数独の答えから、不可避集合を作成する 2. 不可避集合全てと重なりを持つ解候補を作成する(極小頂点被覆列挙) 3. ビット数が17以上なら枝刈り 4. 残った「解候補」についてまじめに解の一意性判定を行う 5. 以上を全ての「答え」について行う

30/30 まとめ https://github.com/kaityo256/mhs_cpp ・極小頂点被覆問題を解くアルゴリズムを実装した・逆探索アルゴリズムにより、効率的な探索が可能・ critical hyperedgeの考え方により、極小性判定を高速化した
サンプルコードは以下で参照可能極小頂点被覆 Qiitaにもいくつか記事を書いたので、そちらも参照のこと

極小頂点被覆列挙問題を解く

極小頂点被覆列挙問題を解く

kaityo256 PRO

More Decks by kaityo256

Other Decks in Programming

Featured

Transcript

1/30 極小頂点被覆列挙問題を解く @kaityo256

2/30 数独と頂点被覆列挙問題 (1/4) 数独ナンプレとも (「数独」はニコリの登録商標) ヒントを頼りに1から9の数字を埋めるペンシルパズル行、列、ボックスごとに1から9までの数字をひとつずつ入れるルール：

3/30 数独と頂点被覆列挙問題 (2/4) 16ヒントの数独で解が一意になるものは存在しない There is no 16-Clue Sudoku [arXiv:1201.0749]

4/30 最小頂点被覆問題(1/3) 学校の開校問題国語、算数、理科、社会、英語の五教科を教える学校を開校したい教師候補は以下の五人教師名担当可能科目給料(コスト) Alice 理科

5/30 最小頂点被覆問題(2/3) 解法の方針コストは考えず、以下の条件を満たす教師の組み合わせを全列挙・五教科全てを教えられる (被覆性) ・一人でも欠けたら五教科を教えられなくなる (極小性)

6/30 最小頂点被覆問題(3/3) Alice Bob Carol Dave Eve 国語算数理科

7/30 頂点被覆問題のグラフ表現 (1/2) Alice Bob Carol Dave Eve A B

8/30 頂点被覆問題のグラフ表現 (2/2) Bob Carol Dave Eve Alice C A

9/30 ヒッティングセット Simple Graph Hyper Graph Vertices Edges Vertices Hyper

10/30 頂点被覆列挙のビット表現 (1/3) 00100100 00011000 00010001 00110000 10000010 00000101 00010010

11/30 頂点被覆列挙のビット表現 (2/3) 00100100 00011000 00010001 00110000 10000010 00000101 00010010

12/30 頂点被覆列挙のビット表現 (3/3) 極小頂点被覆列挙とは 00100100 00011000 00010001 00110000 10000010 00000101

13/30 ナイーブな実装 (1/2) 1 2 3 011 110 000 001

14/30 ナイーブな実装 (2/2) 1 2 3 101 011 110 000

15/30 逆探索アルゴリズム(1/4) 極小頂点被覆列挙をナイーブな再帰で実装すると・極小でないものが出現・重複する解が出現これを解決するのが「逆探索アルゴリズム」逆探索の考え方 1.

16/30 逆探索アルゴリズム(2/4) 部分被覆・入力のビット列がn個とする・その1つ目からk個目までの部分集合を考える・そのk個のビット列に対して極小頂点被覆であるものを k-極小頂点被覆(Minimal Hitting Set, MHS)と呼ぶ

17/30 逆探索アルゴリズム (3/4) いま、tがk-MHSであるとする時、tの親を生成する操作R(t)を以下で定める R(t) = t ^ (t

18/30 逆探索アルゴリズム(4/4) 頂点被覆における親子木の例 000 100 001 110 001 101 011

19/30 逆探索アルゴリズムの実装 (1/2) 1 2 3 011 110 000 001

20/30 逆探索アルゴリズムの実装 (2/2) 1 2 3 101 011 110 000

21/30 極小性判定(1/6) 1. tから1-bit取り除いてみる 2. E_k 全てと重なりチェック 3. 全てのビットについて1.2.を繰り返す 4.

22/30 極小性判定(2/6) Critical Hyperedge もしk-MHSのあるビットを削除した時に、ある辺との重なりがなくなったら、その辺をそのビットのCritical hyperedge (CH)と呼ぶ 101 011

23/30 極小性判定(3/6) 00010010 01100110 10110100 11011000 01000111 01010011 01100110 01010010

25/30 極小性判定(5/6) 00010010 01100110 10110100 11011000 01000111 01010011 01100110 00000010

26/30 極小性判定(6/6) bool check_minimal2(mybit t, int k, mybits &e) {

27/30 実行時間入力データ 32-bitのうち、ランダムに10bit 立っている 200行全部でMHSは1352805個存在するこれを列挙するのにかかった時間を計測 01010000100001111000000100001100 01000010010010010101010001000010

28/30 UA sets (size 4) 不可避集合 (Unavoidable Sets, UA) UA

30/30 まとめ https://github.com/kaityo256/mhs_cpp ・極小頂点被覆問題を解くアルゴリズムを実装した・逆探索アルゴリズムにより、効率的な探索が可能・ critical hyperedgeの考え方により、極小性判定を高速化した