Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
mb_convert_encodingとmb_convert_variablesのautoが違う
Search
てきめん tekimen
PRO
April 12, 2023
Programming
0
230
mb_convert_encodingとmb_convert_variablesのautoが違う
#phpstudy 2023年4月12日
てきめん tekimen
PRO
April 12, 2023
Tweet
Share
More Decks by てきめん tekimen
See All by てきめん tekimen
PHPの次期バージョンはこの時期どうなっているのか - Internalsの開発体制について - PHPカンファレンス小田原
youkidearitai
PRO
1
190
文字とはなにか - PHPの文字コード処理について - PHP Lovers Meetup #5
youkidearitai
PRO
1
120
はじめてのOSSコントリビュート
youkidearitai
PRO
10
2.9k
文字とはなにか - PHPの文字コード処理について -
youkidearitai
PRO
0
400
現在のmbstringの立ち位置 これからどうなっていくのか
youkidearitai
PRO
0
140
PHP 8.3のmbstringの進化を見てください - コントリビューターとしてのかかわり -
youkidearitai
PRO
0
780
PHP 8.2と8.1で取り込まれたプルリクエストについて
youkidearitai
PRO
0
230
非公式mbstringレビュアー 12月と1月
youkidearitai
PRO
0
93
治っていくmbstring ㋿時代の文字化け
youkidearitai
PRO
2
5.9k
Other Decks in Programming
See All in Programming
Ruby GitHub Packages
bkuhlmann
0
630
Let's learn code review
riofujimon
1
310
Komplexe Oberflächen mit SVG und der Web Animation API
joergneumann
0
670
⼤規模⾔語モデルの拡張(RAG)が 終わったかも知れない件について
nearme_tech
23
15k
dbtのドメイン分割による データ基盤の改善とDigdagとの連携
sakama
0
320
冗長なエラーログを削減し、スタックトレースを手に入れる / Reducing Verbose Error Logs and Obtaining Stack Traces
upamune
0
690
SIMD Parallel Programming with the Vector API
josepaumard
0
170
新宿ダンジョンを可視化してみた
satoshi7190
2
260
try!Swift Tokyo 2024 参加報告 LT
akidon0000
1
220
雑に思考を整理する技術と効能
konifar
60
29k
Scalable Customer Journey Orchestration (CJO)
lewuathe
0
310
try! Swift Tokyo 初参加報告LT
hinakko2
0
220
Featured
See All Featured
Dealing with People You Can't Stand - Big Design 2015
cassininazir
357
22k
GraphQLの誤解/rethinking-graphql
sonatard
50
9.2k
StorybookのUI Testing Handbookを読んだ
zakiyama
13
4.6k
4 Signs Your Business is Dying
shpigford
175
21k
Testing 201, or: Great Expectations
jmmastey
28
6.4k
Become a Pro
speakerdeck
PRO
11
4.5k
Producing Creativity
orderedlist
PRO
337
39k
Building Better People: How to give real-time feedback that sticks.
wjessup
355
18k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Stop Working from a Prison Cell
hatefulcrawdad
266
19k
Agile that works and the tools we love
rasmusluckow
325
20k
The Cult of Friendly URLs
andyhume
74
5.7k
Transcript
mb_convert_encodingと mb_convert_variablesのautoが 違う
自己紹介 てきめん • https://tekitoh-memdhoi.info • @youkidearitai • https://www.youtube.com/use r/tekitohmrp •
https://www.nicovideo.jp/user /2957748 • https://github.com/youkideari tai • オレ
早速見ていきましょう https://3v4l.org/tadVr
違いますね • 何ならエラーメッセージすら違いますね – mb_convert_variables(): Unable to detect encoding –
mb_convert_encoding(): Unable to detect character encoding
mb_convert_encodingのマニュアル • string を解釈するのに使われている 現在の文字 エンコーディング。 配列またはカンマ区切りの文字 列とすることで、 複数のエンコーディングを指定で きます。
この場合、正しいエンコーディングを mb_detect_encoding() と同じアルゴリズムで推 測します。 https://www.php.net/mb_convert_encoding
mb_convert_variablesのマニュアル • from_encoding には配列またはカンマ区切りの文 字列を指定し、 from-coding からエンコーディング の検出を試みます。 from_encoding が省略された
場合、detect_order を使用します。 なんか説明が違う https://www.php.net/mb_convert_variables
よくわからないので、php-srcの奥深くへと入っていく ことにした
mb_convert_encodingでは • $from_encodingに”auto”を指定した時、この関 数にやってくる – mb_detect_encodingと同じ関数を使っている
mb_convert_variablesでは • 何やら違う自動判定が 始まった – マニュアルによると「エ ンコーディング検出の ために Array または
Object の文字列を結 合します。」とある
とりあえず、違うことはわかりました • なるべく”auto”は使わないでくださいね – 使ってる文字コードはわかるようにしておきましょう – というか、2023年現在新たに使う人がいるのだろうか? – となると既存システムだよね多分となる
もうちょっと深ぼっていく 何故かSJISに変換できている mb_detect_orderにSJISが載っていないのに https://3v4l.org/CtI1k
なんでこれに気がついたの • Major overhaul of mbstring (part 33)にて気づく – PHP
8.2まででは(mb_detect_order関係なし に)mb_detect_encodingが一番近いエンコーディングを返 すようにしてた – PHP 8.3ではmb_detect_orderに沿ったリストに基づいて変 換されるようになる – なので、PHP 8.3にアップグレードしようとする未来の人々は気 をつけてね(一応UPGRADINGファイルにも記述してもらった)
もうちょい • mbstring.strict_detectionオプションを1にする ことで、厳密な検出ができるようになる – どっちにしても使わないほうが良いです – 繰り返しますが、使っている文字コードはわかっているよ うにしましょう •
今だったらほとんどUTF-8でいい(はず)
おわり ご清聴ありがとうございました