WS12/13 -- Basisinformationstechnologie I | 11: Algorithmen und Datenstrukturen

Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // [email protected]
Basisinformationstechnologie I Wintersemester 2012/13 16. Januar 2013 – Algorithmen und Datenstrukturen

Datenstrukturen  Stack / Kellerspeicher  Queue  Liste 
Baum  Traversierungsarten Such- und Sortieralgorithmen  Lineare Suche  Binäre Suche  Bubble Sort Themenüberblick „Algorithmen und Datenstrukturen“

Objektorientierung

Zentrales Konzept: Objekt Objekt  Verfügt über einen bestimmten Zustand
 Reagiert mit einem definierten Verhalten auf Anforderungen / seine Umgebung  Besitzt eine Identität, die es von anderen Objekten unterscheidet  Kann mit anderen Objekten verbunden sein Objektorientierte Programmierung

Klassen  Eine Klasse definiert für eine Menge von gleichartigen
Objekten deren Struktur (Attribute), Verhalten (Operationen) und Beziehungen.  Stellt den Bauplan dar, nach dem die Objekte gestaltet sind und nach dessen Vorgaben sie sich verhalten  Machen‘s möglich, mehrere Daten (und ihre Zugriffsfunktionen) zusammenzufassen, um einen eigenen Datentyp zu modellieren: Objektorientierte Programmierung

Klassenkonzept / Vererbung

Zentrales Konzept: Kapselung  Information Hiding  Objekte und Funktionen,
die mit der Klasse arbeiten, erhalten nur Informationen über die für sie relevanten Teile der Klasse  Der Zugriff auf die Membervariablen der Klasse wird verborgen und möglich gemacht über entsprechende Methoden der Klasse (Memberfunktionen) Objektorientierte Programmierung

Algorithmen, Datenstrukturen

Algorithmus: Eindeutige Beschreibung eines endlichen Verfahrens zur Lösung einer bestimmten
Klasse von Problemen Komplexität eines Algorithmus: Bedarf an Ressourcen (i.e. Rechenzeit und Speicherplatz) Güte eines Algorithmus:  Qualität der Ergebnisse  Laufzeit / Rechenbedarf des Algorithmus Algorithmen, Datenstrukturen

Datentyp:  Bauplan für eine Variable (benannte Speicherstelle im Arbeitsspeicher
des Rechners)  Legt fest, welche Operationen mit einer Variable möglich sind  Bestimmt die interne Darstellung (Repräsentation) der Variablen im Rechner  Z.B. bool, int, float, double, unsigned int, etc. Algorithmen, Datenstrukturen

Datenstruktur = Daten + Funktionen Datenstrukturen:  Stacks (Stapel) 
Queues  Listen  Einfach verkettete Listen  Doppelt verkettete Listen  Bäume  Binärbäume Algorithmen, Datenstrukturen

Stack / Kellerspeicher

Datenstruktur „Stack“  Auch: „Kellerspeicher“  Abstrakter Datentyp, bei dem
Elemente eingefügt und wieder entfernt werden können LIFO-Prinzip: Last In, First Out – bei der Datenstruktur „Stack“ kann immer nur auf das Element zugegriffen werden, das als letztes eingefügt, d.h. auf den Stapel gelegt wurde

Typische Stackoperationen / Schnittstellen  push(x, s) legt ein Element
x auf den Stack s  top(s) liefert das zuletzt auf den Stack s gelegte Element (ohne das entsprechende Element zu entfernen)  pop(s) entfernt das zuletzt auf den Stack s gelegte Element und gibt es zurück  isEmpty(s) gibt an, ob der Stack s leer ist Datenstruktur Stack

Leerer Stack mit dem Namen audiocdstapel  Prüfen, ob Stack
leer über Funktion isEmpty(audiocdstapel)  gibt TRUE zurück Datenstruktur Stack: Die Praxis

Schritt I: Element auf den Stapel legen  push 
push(„boards of canada – music has the right to children“, audiocdstapel) Datenstruktur Stack: Die Praxis Stack „audiocdstapel“ vor push(…) Stack „audiocdstapel“ nach push(…)

Schritt II: Zahlreiche push-Vorgänge später:  push(„Boards of Canada –
Music has the right to children“, audiocdstapel)  push(„Clark – Iradelphic“, audiocdstapel)  …  Push(„Alt-J – An Awesome Wave“, audiocdstapel) Datenstruktur Stack: Die Praxis

Schritt III: Prüfen, welche CD zuletzt auf den Stapel gelegt
wurde  top  top(audiocdstapel)  gibt „Alt-J – An Awesome Wave“ zurück. Datenstruktur Stack: Die Praxis

Schritt IV: Letztes Stapelelement ausgeben und von Stapel nehmen 
pop  pop(audiocdstapel)  gibt „ Alt-J – An Awesome Wave“ zurück. Stapel nach pop(audiocdstapel): Datenstruktur Stack: Die Praxis

Anwendungsbeispiel Pseudocode: Gehe den Stapel durch und suche nach einer
CD while( !isEmpty(audiocdstapel) ) { currentaudiocd=pop(audiocdstapel); if(currentaudiocd == mycd) { print „CD gefunden“; return currentaudiocd; } } Datenstruktur Stack: Die Praxis

Queue / Warteschlange

Queue, auch „Warteschlange“  geordnete Liste, in der alle Einfügungen
an einem Ende und alle Löschungen am entgegengesetzten Ende stattfinden Operationen:  enQueue  Objekt hinzufügen  deQueue  Objekt zurückgeben, anschließend entfernen Queue

FIFO  First In, First Out  Beispiele: Druckerwarteschlange, Warteschlange
im Supermarkt   „Wer zuerst da ist, mahlt zuerst“ Queue

Listen

Stacks / Queues: Elemente dürfen nur am Anfang oder am
Ende eingefügt bzw. entnommen werden Nachteil Stack / Queue: Sollen beliebige Elemente an beliebiger Stelle eingefügt oder gelöscht werden, wird‘s bei sequentieller Eintragung recht aufwändig Lösung Liste: Folge von Elementen, in der an beliebiger Stelle neue Elemente eingefügt oder vorhandene Elemente entfernt werden können Contra Stack / Queue

Liste  Folge von Elementen; jedes Element = Teil einer
Kette Jeder Eintrag in der Liste verfügt nicht nur über seinen Inhalt, sondern darüber hinaus über einen Zeiger auf das nächste Listenelement: Einfach verkettete Liste

Um die Liste zu durchlaufen:  Beginn beim ersten Element
(„Anker“ für den Beginn der Liste)  „next“ zeigt auf das nächste Listenelement  Letztes Glied der Kette: next-Zeiger = NULL  Um wieder auf das erste Element zugreifen zu können: anfang-Zeiger auf das erste Element der Liste  Hilfszeiger auf innere Elemente: cursor Einfach verkettete Liste

Element Einfügen:  Ursprüngliche Liste:  Liste nach Einfügen von
Element „mat“ Einfach verkettete Liste bat cat sat vat NULL start bat cat sat vat NULL start mat

Element Löschen:  Ursprüngliche Liste:  Liste nach Entfernen des
Elements „cat“ Einfach verkettete Liste bat cat sat vat NULL start bat cat sat vat NULL start

Vorteil:  Elemente lassen sich sehr schnell am Anfang der
einfach verketteten Liste einfügen Nachteil:  Über jedes einzelne Element muss iteriert werden Einfach verkettete Liste bat cat sat vat NULL start

Charakteristika: Jedes Element verfügt über  Einen Inhalt  Einen
Zeiger auf das nachfolgende Element  Einen Zeiger auf das vorhergehende Element Vorteile  Möglichkeit, vom Ende der Liste zum Beginn zu iterieren  Schnelles Löschen und Einfügen von Elementen Nachteil  Speicherplatzbedarf durch zweiten Zeiger erhöht Doppelt verkettete Liste bat cat sat vat NULL start

Datenstrukturen √  Stack / Kellerspeicher √  Queue √
 Liste √  Baum  Traversierungsarten  Such- und Sortieralgorithmen Themenüberblick „Algorithmen und Datenstrukturen“

Bäume

Möglichkeit, hierarchische Strukturen darzustellen, Beispiel: Stammbaum Bäume

Baum = Menge von Knoten und Kanten, die besondere Eigenschaften
aufweisen:  Wurzel: Jeder Baum besitzt genau einen Knoten, der als Wurzel bezeichnet wird  Kante: Jeder Knoten ist außer der Wurzel durch genau eine Kante mit seinem Vaterknoten (auch: „Elternknoten“ oder „Vorgänger“) verbunden  Wird dann auch als Kind (Sohn, Nachfolger) dieses Knotens genannt  Blatt: Ein Knoten ohne Kinder  Innere Knoten: Alle anderen Knoten Kleine Baumschule

Baum: Begrifflichkeiten Bäume Wurzel Kante Innerer Knoten / Kindknoten Blatt

Binärbaum: Definiert als ein Baum, dessen Knoten über höchstens zwei
Kindknoten verfügen dürfen: Binärbäume

Traversieren  Jeden Knoten des Baumes besuchen Reihenfolge, in der
die Knoten besucht werden:  Preorder, auch: „Hauptreihenfolge“ / Tiefensuche  Inorder, auch: „symmetrische Reihenfolge“  Postorder, auch: „Nebenreihenfolge“  Levelorder, auch: „Breitensuche“ Traversierung

Rekursive Regel:  besuche die Wurzel  Besuche den linken
Unterbaum  Besuche den rechten Unterbaum  WLR Preorder Traversierung Quelle: http://de.wikipedia.org/w/index.php?title=Datei:Depth-First-Search.gif&filetimestamp=20090326120256 (MRE)

Preorder Traversierung – Schritt 0 P M S A A
L E T R E E

L E T R E E Ausgabe: P

L E T R E E Ausgabe: P M

L E T R E E Ausgabe: P M S

L E T R E E Ausgabe: P M S A

L E T R E E Ausgabe: P M S A A

L E T R E E Ausgabe: P M S A A L

L E T R E E Ausgabe: P M S A A L E

L E T R E E Ausgabe: P M S A A L E R

L E T R E E Ausgabe: P M S A A L E R T

L E T R E E Ausgabe: P M S A A L E R T E

L E T R E E Ausgabe: P M S A A L E R T E E

Knotenbeziehungen  Achsen:  Elternknoten (parent) – Jedes Element verfügt
über einen Elternknoten. Ausnahme: ???  Vorfahre (ancestor) – Elternknoten von Knoten Beispiel: Der Knoten „2“ ist Vorfahre des Knotens „3“.  Kind (child) – Untergeordnete Knoten Beispiel: „3“ ist Kindknoten von „2“.  Geschwister (siblings): Knoten mit gleichen Elternknoten sind Geschwisterknoten. Beispiel: Der Knoten „3“ ist Geschwisterknoten des Knotens „4“. Bäume und die Praxis: XPath: Navigation 1 2 5 6 3 4

Datenstrukturen √  Stack / Kellerspeicher √  Queue √
 Liste √  Baum √  Traversierungsarten √  Preorder √  Inorder √  Postorder √  Levelorder √ Such- und Sortieralgorithmen Themenüberblick „Algorithmen und Datenstrukturen“

Such- und Sortieralgorithmen

Problemstellung: Wie finden wir eine gesuchte Audio CD? Umgebungsvariablen: 
CD-Sammlung ist unsortiert ODER  Sortierte CD-Sammlung Problemstellung Suche

Sequenzielle / Lineare Suche in unsortierter Sammlung: Anzahl Suchvorgänge bei
n Elementen:  minimal: 1(best case),  maximal: n (worst case)  Durchschnittlich müssen die Hälfte der Einträge durchgesehen werden, um das gewünschte Element zu finden (average case)  Anzahl der Suchschritte steigt proportional mit der Anzahl der Einträge Lineare Suche Quelle und Bildnachweis: http://www-i1.informatik.rwth-aachen.de/~algorithmus/algo1.php

Sortierstrategien / -Verfahren:  Insertionsort: Sortieren durch Einfügen  Analog
dem Vorgehen eines Kartenspielers: Neue Karten werden einzeln einsortiert, bevor die nächste Karte aufgenommen wird  Bubblesort: Vergleichsbasierter Sortieralgorithmus  Heapsort  Quicksort (von C.A.R. Hoare) Sortieralgorithmen

Bubblesort

Bubblesort: Sortiert z.B. ein Array von Datensätzen durch wiederholtes Vertauschen
von Nachbarfeldern, die in falscher Reihenfolge stehen Wird so lange wiederholt, bis das Array vollständig sortiert ist. Dabei wird das Array in mehreren Durchgängen von links nach rechts durchwandert. Bei jedem Durchgang werden alle Nachbarfelder verglichen und ggf. vertauscht. Nach dem 1. Durchgang hat man folgende Situation:  Das größte Element ist ganz rechts.  Alle anderen Elemente sind zwar zum Teil an besseren Positionen (also näher an der endgültigen Position), im Allgemeinen aber noch unsortiert. Wandern des größten Elementes nach rechts  Aufsteigen von Luftblasen: Größte Luftblase steigt nach oben Bubblesort

Zu sortieren ist die Zahlenfolge 55 07 78 12 42
(vgl. http://de.wikipedia.org/wiki/Bubblesort) 1. Durchlauf: 55 07 78 12 42 07 55 78 12 42 07 55 78 12 42 07 55 12 78 42 ? ? ? Bubblesort

Zu sortieren ist die Zahlenfolge 55 07 78 12 42
(vgl. http://de.wikipedia.org/wiki/Bubblesort) 2. Durchlauf: 07 55 12 42 78 07 55 12 42 78 07 12 55 42 78 07 12 42 55 78 07 12 42 55 78 3. Durchlauf: 07 12 42 55 78 07 12 42 55 78 07 12 42 55 78 07 12 42 55 78  Fertig sortiert. Bubblesort

Binäre Suche in sortierter Sammlung:  Gegebenheiten: Suchschlüssel und sortierte
Liste von Einträgen  Start der Suche bei mittlerem Eintrag; Vergleich des Suchschlüssels mit dem Eintrag  Ist der gesuchte Eintrag gefunden, so ist die Suche beendet  Ansonsten: Suche in der linken oder der rechten Hälfte der Einträge - je nachdem, ob der gelesene Schlüssel größer oder kleiner war als der Suchschlüssel  Verfahren so lange, bis der Eintrag gefunden ist oder bis keine Halbierung des Suchraums mehr möglich ist (d.h. man ist an der Stelle angekommen, an der der Eintrag eigentlich stehen müsste). Binäre Suche Quelle und Bildnachweis: http://www-i1.informatik.rwth-aachen.de/~algorithmus/algo1.php

Leistung: Wie viele Suchschritte müssen wir vollziehen, um den gewünschten
Eintrag zu finden?  Beim ersten Suchvorgang halbieren wir die Menge der Einträge  Beim zweiten Suchvorgang halbieren wir die (halbierte) Menge der Einträge erneut  Komplexität: Wir benötigen log2(n) Suchvorgänge, um in einem Array mit n Einträgen das gewünschte Element zu finden Binäre Suche

WS12/13 -- Basisinformationstechnologie I | 11:...

WS12/13 -- Basisinformationstechnologie I | 11: Algorithmen und Datenstrukturen

More Decks by Jan Wieners

Other Decks in Education

Featured

Transcript