るりまサーチ

最速Rubyリファレンスマニュアル検索!
42件ヒット [1-42件を表示] (0.139秒)
トップページ > クエリ:t[x] > 種類:インスタンスメソッド[x] > クエリ:ruby[x] > クエリ:@[x] > クラス:String[x] > クエリ:unicode_normalize[x]

別のキーワード

  1. rbconfig ruby
  2. fiddle ruby_free
  3. fiddle build_ruby_platform
  4. rake ruby
  5. rubygems/defaults ruby_engine

ライブラリ

キーワード

検索結果

String#unicode_normalize(form = :nfc) -> String (21257.0)

self を NFC、NFD、NFKC、NFKD のいずれかの正規化形式で Unicode 正規化し た文字列を返します。

...で Unicode 正規化し
た文字列を返します。

@
param form 正規化形式を :nfc、:nfd、:nfkc、:nfkd のいずれかで指定しま
す。省略した場合は :nfc になります。

@
raise Encoding::CompatibilityError self が Unicode 文字列ではない場合...
...UTF-8、UTF-16BE/LE、
UTF-32BE/LE だけではなく GB18030、UCS_2BE、and UCS_4BE を含みます。

また、self が UTF-8 以外のエンコーディングであった場合は一度 UTF-8 に変
換してから正規化されるため、UTF-8 よりも遅くなっています。

//emlist[...
...例][ruby]{
"a\u0300".unicode_normalize # => 'à' ("\u00E0" と同じ)
"a\u0300".unicode_normalize(:nfc) # => 'à' ("\u00E0" と同じ)
"\u00E0".unicode_normalize(:nfd) # => 'à' ("a\u0300" と同じ)
"\xE0".force_encoding('ISO-8859-1').unicode_normalize(:nfd)...

String#unicode_normalize!(form = :nfc) -> self (9145.0)

self を NFC、NFD、NFKC、NFKD のいずれかの正規化形式で Unicode 正規化し た文字列に置き換えます。

...変換が行なわれなくても self を返します。

@
param form 正規化形式を :nfc、:nfd、:nfkc、:nfkd のいずれかで指定しま
す。省略した場合は :nfc になります。

@
raise Encoding::CompatibilityError self が Unicode 文字列ではない場合...
...に発生します。

//emlist[例][ruby]{
t
ext = "a\u0300"
t
ext.unicode_normalize!(:nfc)
t
ext == "\u00E0" # => true
t
ext.unicode_normalize!(:nfd)
t
ext == "a\u0300" # => true
//}

@
see String#unicode_normalize, String#unicode_normalized?...

String#unicode_normalized?(form = :nfc) -> bool (9138.0)

self が引数 form で指定された正規化形式で Unicode 正規化された文字列か どうかを返します。

...規化された文字列か
どうかを返します。

@
param form 正規化形式を :nfc、:nfd、:nfkc、:nfkd のいずれかで指定しま
す。省略した場合は :nfc になります。

@
raise Encoding::CompatibilityError self が Unicode 文字列ではない場合...
...します。

//emlist[例][ruby]{
"a\u0300".unicode_normalized? # => false
"a\u0300".unicode_normalized?(:nfd) # => true
"\u00E0".unicode_normalized? # => true
"\u00E0".unicode_normalized?(:nfd) # => false
"\xE0".force_encoding('ISO-8859-1').unicode_normalized?...
...# => Encoding::CompatibilityError raised
//}

@
see String#unicode_normalize, String#unicode_normalize!...

String#downcase(*options) -> String (3126.0)

全ての大文字を対応する小文字に置き換えた文字列を返します。 どの文字がどう置き換えられるかは、オプションの有無や文字列のエンコーディングに依存します。

...ディングに依存します。

@
param options オプションの意味は以下の通りです。

: オプションなし
完全な Unicode ケースマッピングに対応し、ほとんどの言語に適しています。(例外は以下の :turkic,
:lithuanian オプションを参照)...
...: :turkic
チュルク語族 (トルコ語、アゼルバイジャン語など) に適合した完全な Unicode ケースマッピングです。
これはたとえば大文字の I は小文字のドットなしの i (ı) にマッピングされることを意味します。

: :lithuanian...
...str.downcase == str.upcase.downcase)。
そして、Unicode 正規化 (すなわち String#unicode_normalize) はケース
マッピング操作で必ずしも維持されるとは限りません。

現在 ASCII 以外のケースマッピング/フォールディングは、UTF-8, UTF-16BE/LE,
UTF...