Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Image recognition of handwritten digits in MNIS...
Search
Dimitris Spathis
January 17, 2016
Research
0
400
Image recognition of handwritten digits in MNIST and flower classification in IRIS dataset
Code available here
https://github.com/sdimi/handwritten-digits-recognition
Dimitris Spathis
January 17, 2016
Tweet
Share
More Decks by Dimitris Spathis
See All by Dimitris Spathis
Song analysis "Jueves - La Oreja de Van Gogh "
sdimi
0
720
Wikipedia graph network analysis
sdimi
0
160
Character level LSTM Recurrent Neural Networks for language and music modeling
sdimi
0
310
Topic modeling and summarization of live TV shows via Twitter
sdimi
0
150
Diagnosing respiratory diseases with machine learning
sdimi
0
170
Detecting Irony on Greek Political Tweets: A Text Mining Approach
sdimi
0
120
Greece Unknown Facts
sdimi
1
190
Glocal News - Discover Top Local News, Globally.
sdimi
0
200
Responsive Web - Mobile First. An overview.
sdimi
1
190
Other Decks in Research
See All in Research
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.4k
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
600
ローテーション別のサイドアウト戦略 ~なぜあのローテは回らないのか?~
vball_panda
0
270
説明可能な機械学習と数理最適化
kelicht
2
870
「リアル×スキマ時間」を活用したUXリサーチ 〜新規事業を前に進めるためのUXリサーチプロセスの設計〜
techtekt
PRO
0
260
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
680
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
66
36k
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
950
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
140
自動運転におけるデータ駆動型AIに対する安全性の考え方 / Safety Engineering for Data-Driven AI in Autonomous Driving Systems
ishikawafyu
0
120
20年前に50代だった人たちの今
hysmrk
0
130
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
180
Featured
See All Featured
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
160
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
0
3.4k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
300
Facilitating Awesome Meetings
lara
57
6.7k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
130
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
52k
Crafting Experiences
bethany
1
35
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
57
Music & Morning Musume
bryan
47
7k
Practical Orchestrator
shlominoach
191
11k
Transcript
Αναγνώριση χειρόγραφων χαρακτήρων στο MNIST dataset & φυτών στο IRIS
dataset με μεθόδους μηχανικής μάθησης Δημήτρης Σπαθής Εξαμηνιαία εργασία – Ιαν 2016 Υπολογιστική Νοημοσύνη – Στατιστική Μάθηση Καθ.: Αναστάσιος Τέφας
MNIST dataset 70.000 εικόνες 28 x 28 pixel 784 διαστάσεις
60.000 train 10.000 test {0,1,2,..9} multi-class
Εργαλεία Python python.org Scikit – learn scikit-learn.org Matplotlib matplotlib.org Numpy
numpy.org
Προεπεξεργασία δεδομένων Ανακάτεμα δειγμάτων X, y = shuffle(mnist.data, mnist.target) Κανονικοποίηση
pixels [0,1] X_train, y_train = np.float32(X[:60000])/ 255., np.float32(y[:60000])
Κρατάμε 90 components 90,3% της αρχικής πληροφορίας PCA – Μείωση
Διάστασης (784 → 90)
Εκπαίδευση SVM fitting classifier = svm.SVC(gamma=0.01, C=3, kernel='rbf') 5 Cross
validation cross_validation.cross_val_score(classifier, X_train, y_train, cv=5)
Αποτελέσματα εκπαίδευσης
Παραδείγματα ταξινόμησης
Μείωση Διάστασης Kernel PCA (784 → 300) kpca = KernelPCA(kernel="rbf",n_components=300
, gamma=1) LDA (300 → 9) lda = LDA() #should keep [classes – 1] components
Nearest Classifier K Nearest Neighbor clf = neighbors.KNeighborsClassifier(n_neighbors=5) Nearest Centroid
classifier = NearestCentroid(metric='euclidean', shrink_threshold=None)
Αποτελέσματα εκπαίδευσης
Embedding για Μείωση Διάστασης (784 → 2) Spectral Embedding manifold.SpectralEmbedding
(n_components=2, affinity='nearest_neighbors', gamma=None, random_state=None, eigen_solver=None, n_neighbors=5) Isomap Embedding manifold.Isomap(n_neighbors=5, n_components=2)
Spectral Clustering Kρατάμε 5000 δείγματα για οπτικοποίηση Spectral Clustering cluster.SpectralClustering(n_clusters=10,
eigen_solver='arpack', affinity="nearest_neighbors")
None
None
Αποτελέσματα clustering
IRIS dataset 150 λουλούδια 4 διαστάσεις sepal length sepal width
petal length petal width 3 κλάσεις Iris Setosa Iris Versicolour Iris Virginica
Αποτελέσματα SVM εκπαίδευσης
SVM fine-tuning C
SVM fine-tuning Degree
SVM fine-tuning Gamma
Μείωση Διάστασης
None
Αποτελέσματα clustering & embedding
None
None
Further work Kernel PCA – Memory Errors Incremental PCA Grid
Search Deep Architectures Distributed / Parallel MapReduce / Spark Κώδικας σύντομα στο github.com/sdimi