" , "" ], "language":"american", "normalize":"options", "norm_options": [ "WHITESPACE" ] }') Copyright © 2024, Oracle and/or its affiliates 18 パラメータ 説明 指定可能な値 補足 by データ分割の方法を文字、単語、 語彙トークンで指定 デフォルト:by words by characters 文字数で計算して分割 by words 単語数を計算して分割 単語ごとに空白文字が入る言語が対象 日本語、中国語、タイ語などの場合、 1文字が1単語としてみなされる by vocabulary 語彙のトークン数を計算して分割 CREATE_VOCABULARYパッケージを使って 語彙登録が可能 max データ分割の方法に応じてそれぞれの方法に おける最大数を指定 ここで指定した最大数に 達したときにデータを分割する デフォルト:100 50〜4000 by charactersの場合 10〜1000 by wordsの場合 10〜1000 by vocabularyの場合