検索結果
先頭5件
-
Encoding
:: EUCJP -> Encoding (72991.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
:: EUCJP _ MS -> Encoding (37111.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: EucJP _ ms -> Encoding (37111.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: EucJP -> Encoding (36991.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
:: EUC _ JP _ MS -> Encoding (27811.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: EUC _ JP -> Encoding (27691.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
. aliases -> Hash (18745.0) -
エンコーディングの別名に対して元の名前を対応づけるハッシュを返します。
エンコーディングの別名に対して元の名前を対応づけるハッシュを返します。
//emlist[例][ruby]{
p Encoding.aliases
#=> {"BINARY"=>"ASCII-8BIT", "ASCII"=>"US-ASCII", "ANSI_X3.4-1968"=>"US-ASCII",
# "SJIS"=>"Windows-31J", "eucJP"=>"EUC-JP", "CP932"=>"Windows-31J"}
//} -
Encoding
. name _ list -> [String] (18745.0) -
利用可能なエンコーディングの名前を文字列の配列で返します。
利用可能なエンコーディングの名前を文字列の配列で返します。
//emlist[例][ruby]{
p Encoding.name_list
#=> ["US-ASCII", "ASCII-8BIT", "UTF-8",
# "ISO-8859-1", "Shift_JIS", "EUC-JP",
# "Windows-31J",
# "BINARY", "CP932", "eucJP", ...]
//} -
Encoding
. locale _ charmap -> String | nil (18673.0) -
ロケールエンコーディングを決定するために用いる、locale charmap 名を返します。nl_langinfo 等がない環境では nil を、miniruby では ASCII_8BIT を返します。
ロケールエンコーディングを決定するために用いる、locale charmap 名を返します。nl_langinfo 等がない環境では nil を、miniruby では ASCII_8BIT を返します。
//emlist[Debian GNU/Linux + LANG=C][ruby]{
Encoding.locale_charmap #=> "ANSI_X3.4-1968"
//}
//emlist[LANG=ja_JP.EUC-JP][ruby]{
Encoding.locale_charmap #=> "EUC-JP"
//}
//emlist[SunOS 5 + LANG=C]... -
NKF
. # guess(str) -> Encoding (18619.0) -
文字列 str の漢字コードを推測して返します。
文字列 str の漢字コードを推測して返します。
返される値は、NKF モジュールのモジュール定数です。
返される値(すなわち、推測可能なエンコーディング)は以下のいずれかです。
* NKF::JIS
* NKF::EUC
* NKF::SJIS
* NKF::UNKNOWN
* NKF::UTF8
* NKF::UTF16
* Encoding::EUCJP_MS
* Encoding::CP51932
* Encoding::WINDOWS_31J
@param str 推測対象の文字列です。 -
NKF (2539.0)
-
nkf(Network Kanji code conversion Filter, https://osdn.net/projects/nkf/) を Ruby から使うためのモジュールです。
nkf(Network Kanji code conversion Filter, https://osdn.net/projects/nkf/) を
Ruby から使うためのモジュールです。
=== 使い方
以下は、漢字コード変換コマンドの例です。
//emlist[例][ruby]{
#!/usr/local/bin/ruby
require 'nkf'
opt = ''
opt = ARGV.shift if ARGV[0][0] == ?-
while line = ARGF.gets
print NKF.nkf(opt, line)
end
//}
以下は、漢字コー...