Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Image recognition of handwritten digits in MNIS...
Search
Dimitris Spathis
January 17, 2016
Research
0
380
Image recognition of handwritten digits in MNIST and flower classification in IRIS dataset
Code available here
https://github.com/sdimi/handwritten-digits-recognition
Dimitris Spathis
January 17, 2016
Tweet
Share
More Decks by Dimitris Spathis
See All by Dimitris Spathis
Song analysis "Jueves - La Oreja de Van Gogh "
sdimi
0
680
Wikipedia graph network analysis
sdimi
0
150
Character level LSTM Recurrent Neural Networks for language and music modeling
sdimi
0
300
Topic modeling and summarization of live TV shows via Twitter
sdimi
0
140
Diagnosing respiratory diseases with machine learning
sdimi
0
160
Detecting Irony on Greek Political Tweets: A Text Mining Approach
sdimi
0
120
Greece Unknown Facts
sdimi
1
190
Glocal News - Discover Top Local News, Globally.
sdimi
0
200
Responsive Web - Mobile First. An overview.
sdimi
1
190
Other Decks in Research
See All in Research
Sosiaalisen median katsaus 03/2025 + tekoäly
hponka
0
1.3k
ウッドスタックチャン:木材を用いた小型エージェントロボットの開発と印象評価 / ec75-sato
yumulab
1
410
「エージェントって何?」から「実際の開発現場で役立つ考え方やベストプラクティス」まで
mickey_kubo
0
120
公立高校入試等に対する受入保留アルゴリズム(DA)導入の提言
shunyanoda
0
5.7k
在庫管理のための機械学習と最適化の融合
mickey_kubo
3
1.1k
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
240
数理最適化と機械学習の融合
mickey_kubo
15
8.8k
Collaborative Development of Foundation Models at Japanese Academia
odashi
2
560
実行環境に中立なWebAssemblyライブマイグレーション機構/techtalk-2025spring
chikuwait
0
220
ASSADS:ASMR動画に合わせて撫でられる感覚を提示するシステムの開発と評価 / ec75-shimizu
yumulab
1
380
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
laysakura
0
1.5k
Generative Models 2025
takahashihiroshi
21
11k
Featured
See All Featured
How to train your dragon (web standard)
notwaldorf
93
6.1k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
Testing 201, or: Great Expectations
jmmastey
42
7.5k
KATA
mclloyd
29
14k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.7k
Done Done
chrislema
184
16k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Statistics for Hackers
jakevdp
799
220k
Unsuck your backbone
ammeep
671
58k
Producing Creativity
orderedlist
PRO
346
40k
Git: the NoSQL Database
bkeepers
PRO
430
65k
BBQ
matthewcrist
89
9.7k
Transcript
Αναγνώριση χειρόγραφων χαρακτήρων στο MNIST dataset & φυτών στο IRIS
dataset με μεθόδους μηχανικής μάθησης Δημήτρης Σπαθής Εξαμηνιαία εργασία – Ιαν 2016 Υπολογιστική Νοημοσύνη – Στατιστική Μάθηση Καθ.: Αναστάσιος Τέφας
MNIST dataset 70.000 εικόνες 28 x 28 pixel 784 διαστάσεις
60.000 train 10.000 test {0,1,2,..9} multi-class
Εργαλεία Python python.org Scikit – learn scikit-learn.org Matplotlib matplotlib.org Numpy
numpy.org
Προεπεξεργασία δεδομένων Ανακάτεμα δειγμάτων X, y = shuffle(mnist.data, mnist.target) Κανονικοποίηση
pixels [0,1] X_train, y_train = np.float32(X[:60000])/ 255., np.float32(y[:60000])
Κρατάμε 90 components 90,3% της αρχικής πληροφορίας PCA – Μείωση
Διάστασης (784 → 90)
Εκπαίδευση SVM fitting classifier = svm.SVC(gamma=0.01, C=3, kernel='rbf') 5 Cross
validation cross_validation.cross_val_score(classifier, X_train, y_train, cv=5)
Αποτελέσματα εκπαίδευσης
Παραδείγματα ταξινόμησης
Μείωση Διάστασης Kernel PCA (784 → 300) kpca = KernelPCA(kernel="rbf",n_components=300
, gamma=1) LDA (300 → 9) lda = LDA() #should keep [classes – 1] components
Nearest Classifier K Nearest Neighbor clf = neighbors.KNeighborsClassifier(n_neighbors=5) Nearest Centroid
classifier = NearestCentroid(metric='euclidean', shrink_threshold=None)
Αποτελέσματα εκπαίδευσης
Embedding για Μείωση Διάστασης (784 → 2) Spectral Embedding manifold.SpectralEmbedding
(n_components=2, affinity='nearest_neighbors', gamma=None, random_state=None, eigen_solver=None, n_neighbors=5) Isomap Embedding manifold.Isomap(n_neighbors=5, n_components=2)
Spectral Clustering Kρατάμε 5000 δείγματα για οπτικοποίηση Spectral Clustering cluster.SpectralClustering(n_clusters=10,
eigen_solver='arpack', affinity="nearest_neighbors")
None
None
Αποτελέσματα clustering
IRIS dataset 150 λουλούδια 4 διαστάσεις sepal length sepal width
petal length petal width 3 κλάσεις Iris Setosa Iris Versicolour Iris Virginica
Αποτελέσματα SVM εκπαίδευσης
SVM fine-tuning C
SVM fine-tuning Degree
SVM fine-tuning Gamma
Μείωση Διάστασης
None
Αποτελέσματα clustering & embedding
None
None
Further work Kernel PCA – Memory Errors Incremental PCA Grid
Search Deep Architectures Distributed / Parallel MapReduce / Spark Κώδικας σύντομα στο github.com/sdimi