ライブラリ
- ビルトイン (103)
- base64 (2)
-
cgi
/ core (1) - csv (1)
-
irb
/ input-method (3) -
irb
/ magic-file (1) - kconv (6)
-
net
/ http (1) - nkf (5)
- objspace (1)
- open-uri (2)
- openssl (1)
- psych (4)
-
rexml
/ document (9) - rss (2)
- scanf (2)
- uri (2)
-
webrick
/ httprequest (2) -
webrick
/ httpresponse (1) -
webrick
/ httputils (1)
クラス
- Array (1)
- CSV (1)
- Dir (2)
- Encoding (54)
-
Encoding
:: Converter (14) -
Encoding
:: InvalidByteSequenceError (7) -
Encoding
:: UndefinedConversionError (5) -
IRB
:: FileInputMethod (1) -
IRB
:: ReadlineInputMethod (1) -
IRB
:: StdioInputMethod (1) -
Psych
:: Nodes :: Stream (1) -
Psych
:: Stream (2) -
Psych
:: Visitors :: YAMLTree (1) -
REXML
:: Document (5) -
REXML
:: Instruction (2) -
REXML
:: XMLDecl (1) - Regexp (1)
- String (18)
-
WEBrick
:: HTTPRequest (2) -
WEBrick
:: HTTPResponse (1)
モジュール
- Base64 (2)
-
CGI
:: QueryExtension (1) - Kconv (5)
- NKF (5)
-
Net
:: HTTPHeader (1) - ObjectSpace (1)
-
OpenURI
:: Meta (2) -
RSS
:: RootElementMixin (2) - URI (2)
オブジェクト
-
IRB
:: MagicFile (1)
キーワード
-
1
. 6 . 8から1 . 8 . 0への変更点(まとめ) (1) -
BIG5
_ UAO (1) -
Big5
_ UAO (1) - Buffering (1)
- ConverterNotFoundError (1)
-
EBCDIC
_ CP _ US (1) -
EMACS
_ MULE (1) -
ENCODING
_ SPEC _ RE (1) - EUC (2)
- EUCCN (1)
- EUCJP (1)
-
EUCJP
_ MS (1) - EUCKR (1)
- EUCTW (1)
-
EUC
_ CN (1) -
EUC
_ JP (1) -
EUC
_ JP _ MS (1) -
EUC
_ KR (1) -
EUC
_ TW (1) -
Emacs
_ Mule (1) - EucCN (1)
- EucJP (1)
-
EucJP
_ ms (1) - EucKR (1)
- EucTW (1)
- FormData (1)
- IBM037 (1)
- Instruction (1)
- InvalidByteSequenceError (1)
-
KOI8
_ U (1) - MACCENTEURO (1)
- MACTURKISH (1)
- MACUKRAINE (1)
- MacCentEuro (1)
- MacTurkish (1)
- MacUkraine (1)
- Marshal フォーマット (1)
-
NEWS for Ruby 2
. 0 . 0 (1) -
NEWS for Ruby 2
. 3 . 0 (1) - Rubyの起動 (1)
- Ruby用語集 (1)
- String (1)
-
UCS
_ 2BE (1) -
UCS
_ 4BE (1) -
UCS
_ 4LE (1) -
US
_ ASCII (1) - UTF16 (2)
- UTF32 (2)
- UTF8 (2)
-
UTF8
_ DOCOMO (1) -
UTF8
_ DoCoMo (1) -
UTF8
_ KDDI (1) -
UTF8
_ MAC (1) -
UTF8
_ SOFTBANK (1) -
UTF8
_ SoftBank (1) -
UTF
_ 16 (1) -
UTF
_ 16BE (1) -
UTF
_ 16LE (1) -
UTF
_ 32 (1) -
UTF
_ 32BE (1) -
UTF
_ 32LE (1) -
UTF
_ 7 (1) -
UTF
_ 8 (1) -
UTF
_ 8 _ HFS (1) -
UTF
_ 8 _ MAC (1) - UndefinedConversionError (1)
-
accept
_ encoding (2) - casecmp (1)
- chunked= (1)
- chunked? (1)
- content (1)
-
content
_ encoding (1) - convert (1)
-
count
_ tdata _ objects (1) -
decode
_ www _ form (1) -
decode
_ www _ form _ component (1) -
default
_ external (1) -
default
_ external= (1) -
default
_ internal (1) -
default
_ internal= (1) -
destination
_ encoding (2) -
destination
_ encoding _ name (2) - dummy? (1)
- encode (3)
-
error
_ bytes (1) -
error
_ char (1) - finish (1)
-
fixed
_ encoding? (1) -
force
_ encoding (1) - foreach (3)
- guess (2)
-
incomplete
_ input? (1) -
insert
_ output (1) - iseuc (1)
- new (4)
- open-uri (1)
-
output
_ encoding (1) -
output
_ encoding= (1) - pack (1)
- pack テンプレート文字列 (1)
-
primitive
_ convert (4) - putback (2)
- query (1)
-
readagain
_ bytes (1) - replacement= (1)
- replicate (1)
-
rexml
/ document (1) -
rexml
/ parsers / pullparser (1) -
rexml
/ parsers / ultralightparser (1) -
ruby 1
. 8 . 2 feature (1) -
ruby 1
. 8 . 3 feature (1) -
ruby 1
. 8 . 4 feature (1) -
ruby 1
. 9 feature (1) - scanf (2)
- scrub (3)
- scrub! (3)
-
search
_ convpath (1) -
source
_ encoding (3) -
source
_ encoding _ name (2) -
stand
_ alone? (1) - start (3)
- target (1)
-
unicode
_ normalize (1) -
unicode
_ normalize! (1) -
unicode
_ normalized? (1) - unpack (1)
-
urlsafe
_ decode64 (1) -
urlsafe
_ encode64 (1) - version (1)
- write (2)
- リテラル (1)
- 多言語化 (1)
- 正規表現 (1)
検索結果
先頭5件
-
IRB
:: FileInputMethod # encoding -> Encoding (63607.0) -
読み込んだファイルの文字エンコーディングを返します。
読み込んだファイルの文字エンコーディングを返します。 -
IRB
:: ReadlineInputMethod # encoding -> Encoding (63607.0) -
自身の文字エンコーディングを返します。
自身の文字エンコーディングを返します。 -
IRB
:: StdioInputMethod # encoding -> Encoding (63607.0) -
自身の文字エンコーディングを返します。
自身の文字エンコーディングを返します。 -
REXML
:: Document # encoding -> String (63340.0) -
XML 宣言に含まれている XML 文書のエンコーディングを返します。
XML 宣言に含まれている XML 文書のエンコーディングを返します。
文書が XML 宣言を持たない場合はデフォルトの値
(REXML::XMLDecl.defaultで宣言されているもの)を返します。
//emlist[][ruby]{
require 'rexml/document'
doc = REXML::Document.new(<<EOS)
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<e />
EOS
doc.encoding # => "UTF-8"
//} -
RSS
:: RootElementMixin # output _ encoding (54907.0) -
@todo
@todo -
RSS
:: RootElementMixin # output _ encoding= (54907.0) -
@todo
@todo -
Encoding
:: InvalidByteSequenceError # source _ encoding -> Encoding (46027.0) -
エラーを発生させた変換の変換元のエンコーディングを Encoding オブジェクトで返します。
エラーを発生させた変換の変換元のエンコーディングを Encoding
オブジェクトで返します。
@see Encoding::InvalidByteSequenceError#destination_encoding,
Encoding::UndefinedConversionError#source_encoding -
Encoding
:: UndefinedConversionError # source _ encoding -> Encoding (45991.0) -
エラーを発生させた変換の変換元のエンコーディングを Encoding オブジェクトで返します。
エラーを発生させた変換の変換元のエンコーディングを Encoding
オブジェクトで返します。
変換が多段階になされる場合は元の文字列のものではない
エンコーディングが返される場合があることに注意してください。
@see Encoding::UndefinedConversionError#destination_encoding -
Encoding
:: Converter # source _ encoding -> Encoding (45961.0) -
変換元のエンコーディングを返します。
変換元のエンコーディングを返します。
@return 変換元のエンコーディング
//emlist[][ruby]{
ec = Encoding::Converter.new("utf-8", "euc-jp")
ec.source_encoding #=> #<Encoding:UTF-8>
//} -
Encoding
:: InvalidByteSequenceError # source _ encoding _ name -> Encoding (45943.0) -
エラーを発生させた変換の変換元のエンコーディングを文字列で返します。
エラーを発生させた変換の変換元のエンコーディングを文字列で返します。
@see Encoding::InvalidByteSequenceError#source_encoding -
Encoding
:: UndefinedConversionError # source _ encoding _ name -> Encoding (45943.0) -
エラーを発生させた変換の変換元のエンコーディングを文字列で返します。
エラーを発生させた変換の変換元のエンコーディングを文字列で返します。
@see Encoding::UndefinedConversionError#source_encoding -
Encoding
:: Converter # insert _ output(string) -> nil (45727.0) -
変換器内のバッファに文字列を挿入します。 バッファに保持された文字列は、次の変換時の変換結果と一緒に返されます。
変換器内のバッファに文字列を挿入します。
バッファに保持された文字列は、次の変換時の変換結果と一緒に返されます。
変換先がステートフルなエンコーディングであった場合、
挿入された文字列は状態に基づいて変換され、状態を更新します。
このメソッドは変換に際してエラーが発生した際にのみ利用されるべきです。
@param string 挿入する文字列
//emlist[][ruby]{
ec = Encoding::Converter.new("utf-8", "iso-8859-1")
src = "HIRAGANA LETTER A is \u{3042}."
dst = ""
p ec.... -
Encoding
. default _ internal -> Encoding | nil (45676.0) -
既定の内部エンコーディングを返します。デフォルトでは nil です。
既定の内部エンコーディングを返します。デフォルトでは nil です。
標準入出力、コマンドライン引数、open で開くファイルなどで、内部エンコーディングが指定されていない場合の既定値として利用されます。
String#encode と String#encode! は、引数に Encoding が与えられていない場合、 default_internal を使用します。
文字列リテラルを作成した場合、エンコーディングには default_internal ではなく __ENCODING__ 特殊変数で参照できるスクリプトエンコーディングが使用されます。
default_internal... -
Encoding
:: KOI8 _ U -> Encoding (45673.0) -
KOI8-U エンコーディング。
KOI8-U エンコーディング。
ウクライナ語のキリル文字で使われる8bit single-byteエンコーディングです。
@see https://en.wikipedia.org/wiki/KOI8-U -
Encoding
. default _ external -> Encoding (45658.0) -
既定の外部エンコーディングを返します。
既定の外部エンコーディングを返します。
標準入出力、コマンドライン引数、open で開くファイルなどで、外部エンコーディングが指定されていない場合の既定値として利用されます。
Rubyはロケールまたは -E オプションに従って default_external を決定します。ロケールの確認・設定方法については各システムのマニュアルを参照してください。
default_external は必ず設定されます。Encoding.locale_charmap が nil を返す場合には US-ASCII が、
ロケールにRubyが扱えないエンコーディングが指定されている場合には ASCII-8... -
Encoding
. default _ external=(encoding) (45658.0) -
既定の外部エンコーディングを設定します。
既定の外部エンコーディングを設定します。
default_external を変更する前に作成した文字列と、default_external を変更した後に作成した文字列とではエンコーディングが異なる可能性があるため、Ruby スクリプト内で Encoding.default_external を設定してはいけません。代わりに、ruby -E を使用して、正しい default_external で Ruby を起動してください。
デフォルトの外部エンコーディングがどのように使われるかについては Encoding.default_external を参照してください。
@see spec... -
Encoding
. default _ internal=(encoding) (45658.0) -
既定の内部エンコーディングを設定します。
既定の内部エンコーディングを設定します。
default_internal を変更する前に作成した文字列と、default_internal を変更した後に作成した文字列とではエンコーディングが異なる可能性があるため、Ruby スクリプト内で Encoding.default_internal を設定してはいけません。代わりに、ruby -E を使用して、正しい default_internal で Ruby を起動してください。
デフォルトの内部エンコーディングがどのように使われるかについては Encoding.default_internal を参照してください。
@see spe... -
Encoding
:: EUCJP _ MS -> Encoding (45628.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: EUC _ JP _ MS -> Encoding (45628.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: EucJP _ ms -> Encoding (45628.0) -
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
eucJP-ms、Unix 系で用いられる、日本語 EUC 亜種です。
EUC-JPに加え、Windowsの機種依存文字とユーザ定義文字を扱うことができます。
@see http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/eucJP-ms.html,
http://legacy-encoding.osdn.jp/wiki/index.php?eucJP-ms,
http://blog.livedoor.jp/numa2666/archives/50980727.html -
Encoding
:: BIG5 _ UAO -> Encoding (45625.0) -
Big5_UAO エンコーディングです。
Big5_UAO エンコーディングです。
Big5 の亜種(非公式的拡張)です。
Unicodeとの対応表が
http://moztw.org/docs/big5/table/big5_2003-b2u.txt
にあります。 -
Encoding
:: Big5 _ UAO -> Encoding (45625.0) -
Big5_UAO エンコーディングです。
Big5_UAO エンコーディングです。
Big5 の亜種(非公式的拡張)です。
Unicodeとの対応表が
http://moztw.org/docs/big5/table/big5_2003-b2u.txt
にあります。 -
Encoding
:: MACCENTEURO -> Encoding (45625.0) -
MacCentEuro エンコーディング。
MacCentEuro エンコーディング。
Mac OSで使われる
8bit single-byteエンコーディングで、
中欧および南東欧の言語を取り扱うものです。
@see https://en.wikipedia.org/wiki/Macintosh_Central_European_encoding -
Encoding
:: MACUKRAINE -> Encoding (45625.0) -
MacUkraine エンコーディング。
MacUkraine エンコーディング。
Mac OS で使われる、ウクライナ語キリル文字を取り扱うエンコーディング。
MacCyrillic の亜種です。
@see https://en.wikipedia.org/wiki/Macintosh_Ukrainian_encoding -
Encoding
:: MacCentEuro -> Encoding (45625.0) -
MacCentEuro エンコーディング。
MacCentEuro エンコーディング。
Mac OSで使われる
8bit single-byteエンコーディングで、
中欧および南東欧の言語を取り扱うものです。
@see https://en.wikipedia.org/wiki/Macintosh_Central_European_encoding -
Encoding
:: MacUkraine -> Encoding (45625.0) -
MacUkraine エンコーディング。
MacUkraine エンコーディング。
Mac OS で使われる、ウクライナ語キリル文字を取り扱うエンコーディング。
MacCyrillic の亜種です。
@see https://en.wikipedia.org/wiki/Macintosh_Ukrainian_encoding -
Encoding
:: EUCCN -> Encoding (45610.0) -
ENC-CN エンコーディングです。
ENC-CN エンコーディングです。
中国で用いられる簡体字中国語 EUCのエンコーディングです。
GB2312 と呼ばれることも多いです。 -
Encoding
:: EUCJP -> Encoding (45610.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
:: EUCKR -> Encoding (45610.0) -
EUC-KR エンコーディングです。
EUC-KR エンコーディングです。
韓国語 EUC のエンコーディングです。 -
Encoding
:: EUCTW -> Encoding (45610.0) -
EUC-TW エンコーディングです。
EUC-TW エンコーディングです。
台湾で用いられる繁体字中国語 EUCのエンコーディングです。 -
Encoding
:: EUC _ CN -> Encoding (45610.0) -
ENC-CN エンコーディングです。
ENC-CN エンコーディングです。
中国で用いられる簡体字中国語 EUCのエンコーディングです。
GB2312 と呼ばれることも多いです。 -
Encoding
:: EUC _ JP -> Encoding (45610.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
:: EUC _ KR -> Encoding (45610.0) -
EUC-KR エンコーディングです。
EUC-KR エンコーディングです。
韓国語 EUC のエンコーディングです。 -
Encoding
:: EUC _ TW -> Encoding (45610.0) -
EUC-TW エンコーディングです。
EUC-TW エンコーディングです。
台湾で用いられる繁体字中国語 EUCのエンコーディングです。 -
Encoding
:: EucCN -> Encoding (45610.0) -
ENC-CN エンコーディングです。
ENC-CN エンコーディングです。
中国で用いられる簡体字中国語 EUCのエンコーディングです。
GB2312 と呼ばれることも多いです。 -
Encoding
:: EucJP -> Encoding (45610.0) -
IANA Character Sets にある EUC-JP のことです。
IANA Character Sets にある EUC-JP のことです。
日本語 EUC 亜種で、G0 が US-ASCII、G1 が JIS X 0201 片仮名図形文字集合、G2 が JIS X 0208、G3 が JIS X 0212 となっています。
EUC-JP を指定する場合は、それが実際には CP51932 のことである可能性を考えなければなりません。 -
Encoding
:: EucKR -> Encoding (45610.0) -
EUC-KR エンコーディングです。
EUC-KR エンコーディングです。
韓国語 EUC のエンコーディングです。 -
Encoding
:: EucTW -> Encoding (45610.0) -
EUC-TW エンコーディングです。
EUC-TW エンコーディングです。
台湾で用いられる繁体字中国語 EUCのエンコーディングです。 -
Encoding
:: UTF8 _ MAC -> Encoding (45610.0) -
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
@see http://developer.apple.com/jp/technotes/tn1150.html,
http://developer.apple.com/jp/technotes/tn2078.html -
Encoding
:: UTF _ 8 _ HFS -> Encoding (45610.0) -
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
@see http://developer.apple.com/jp/technotes/tn1150.html,
http://developer.apple.com/jp/technotes/tn2078.html -
Encoding
:: UTF _ 8 _ MAC -> Encoding (45610.0) -
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
UTF8-MAC、アップルによって修正された Normalization Form D(分解済み)という形式のUTF-8です。
@see http://developer.apple.com/jp/technotes/tn1150.html,
http://developer.apple.com/jp/technotes/tn2078.html -
Encoding
:: EBCDIC _ CP _ US -> Encoding (45607.0) -
IBM037 エンコーディング。
IBM037 エンコーディング。
ダミーエンコーディングです。
@see https://en.wikipedia.org/wiki/EBCDIC_037 -
Encoding
:: EMACS _ MULE -> Encoding (45607.0) -
Emacs-Mule エンコーディングです。
Emacs-Mule エンコーディングです。
Emacsの多言語化(Mule)で使われているステートレスのエンコーディングです。
@see http://web.archive.org/web/20100714080650/http://www.m17n.org/mule/pricai96/mule.en.html -
Encoding
:: Emacs _ Mule -> Encoding (45607.0) -
Emacs-Mule エンコーディングです。
Emacs-Mule エンコーディングです。
Emacsの多言語化(Mule)で使われているステートレスのエンコーディングです。
@see http://web.archive.org/web/20100714080650/http://www.m17n.org/mule/pricai96/mule.en.html -
Encoding
:: MACTURKISH -> Encoding (45607.0) -
MacTurkish エンコーディング。
MacTurkish エンコーディング。
Mac OSで使われる
8bit single-byte エンコーディングで、
トルコ語のために使われます。
@see https://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/TURKISH.TXT -
Encoding
:: MacTurkish -> Encoding (45607.0) -
MacTurkish エンコーディング。
MacTurkish エンコーディング。
Mac OSで使われる
8bit single-byte エンコーディングで、
トルコ語のために使われます。
@see https://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/TURKISH.TXT -
Encoding
:: UCS _ 2BE -> Encoding (45607.0) -
UTF-16BE (ビッグエンディアン) です。
UTF-16BE (ビッグエンディアン) です。
BOM を含みません。 -
Encoding
:: UCS _ 4BE -> Encoding (45607.0) -
UTF-32BE (ビッグエンディアン) です。
UTF-32BE (ビッグエンディアン) です。
BOM を含みません。 -
Encoding
:: UCS _ 4LE -> Encoding (45607.0) -
UTF-32LE (リトルエンディアン) です。
UTF-32LE (リトルエンディアン) です。
BOM を含みません。 -
Encoding
:: UTF8 _ DOCOMO -> Encoding (45607.0) -
UTF8-DoCoMo エンコーディングです。
UTF8-DoCoMo エンコーディングです。
UTF-8 の亜種です。
DoCoMo の携帯電話で使われる絵文字が含まれています。
@see https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/basic/index.html,
https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/extention/index.html -
Encoding
:: UTF8 _ DoCoMo -> Encoding (45607.0) -
UTF8-DoCoMo エンコーディングです。
UTF8-DoCoMo エンコーディングです。
UTF-8 の亜種です。
DoCoMo の携帯電話で使われる絵文字が含まれています。
@see https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/basic/index.html,
https://www.nttdocomo.co.jp/english/service/developer/make/content/pictograph/extention/index.html -
Encoding
:: UTF8 _ SOFTBANK -> Encoding (45607.0) -
UTF8-SoftBank エンコーディングです。
UTF8-SoftBank エンコーディングです。
UTF-8 の亜種です。
SoftBank の携帯電話で使われる絵文字が含まれています。
@see http://creation.mb.softbank.jp/mc/tech/tech_pic/pic_index.html -
Encoding
:: UTF8 _ SoftBank -> Encoding (45607.0) -
UTF8-SoftBank エンコーディングです。
UTF8-SoftBank エンコーディングです。
UTF-8 の亜種です。
SoftBank の携帯電話で使われる絵文字が含まれています。
@see http://creation.mb.softbank.jp/mc/tech/tech_pic/pic_index.html -
Encoding
:: UTF _ 16BE -> Encoding (45607.0) -
UTF-16BE (ビッグエンディアン) です。
UTF-16BE (ビッグエンディアン) です。
BOM を含みません。 -
Encoding
:: UTF _ 32BE -> Encoding (45607.0) -
UTF-32BE (ビッグエンディアン) です。
UTF-32BE (ビッグエンディアン) です。
BOM を含みません。 -
Encoding
:: UTF _ 32LE -> Encoding (45607.0) -
UTF-32LE (リトルエンディアン) です。
UTF-32LE (リトルエンディアン) です。
BOM を含みません。 -
Encoding
:: UTF8 _ KDDI -> Encoding (45604.0) -
UTF8-KDDI エンコーディングです。
UTF8-KDDI エンコーディングです。
UTF8 の亜種です。
KDDI の携帯電話で使われる絵文字が含まれています。
@see https://www.au.com/ezfactory/tec/spec/img/typeD.pdf -
Encoding
:: UTF _ 16 -> Encoding (45604.0) -
UTF-16 (BOMを含む) です。
UTF-16 (BOMを含む) です。
ダミーエンコーディングです。 -
Encoding
:: UTF _ 16LE -> Encoding (45604.0) -
UTF-16LE (リトルエンディアン) です。
UTF-16LE (リトルエンディアン) です。
BOM を含みません。 -
Encoding
:: UTF _ 32 -> Encoding (45604.0) -
UTF-32 (BOMを含む) です。
UTF-32 (BOMを含む) です。
ダミーエンコーディングです。 -
Encoding
# dummy? -> bool (45337.0) -
自身がダミーエンコーディングである場合に true を返します。 そうでない場合に false を返します。
自身がダミーエンコーディングである場合に true を返します。
そうでない場合に false を返します。
ダミーエンコーディングとは Ruby が名前を知っているものの実質的には対応していないエンコーディングのことです。例えば、ダミーエンコーディングで符号化された文字列の場合、 String#length はマルチバイト文字を考慮せずにバイト列の長さを返します。
ダミーエンコーディングも IO の外部エンコーディングに指定できます。また
Ruby はサポートしていないが拡張ライブラリがサポートしているエンコーディングを扱う場合にも
用います。
//emlist[例][ruby]{
E... -
Encoding
:: InvalidByteSequenceError # destination _ encoding -> Encoding (36727.0) -
エラーを発生させた変換の変換先のエンコーディングを Encoding オブジェクトで返します。
エラーを発生させた変換の変換先のエンコーディングを Encoding
オブジェクトで返します。
@see Encoding::InvalidByteSequenceError#source_encoding,
Encoding::UndefinedConversionError#destination_encoding -
Encoding
:: UndefinedConversionError # destination _ encoding -> Encoding (36691.0) -
エラーを発生させた変換の変換先のエンコーディングを Encoding オブジェクトで返します。
エラーを発生させた変換の変換先のエンコーディングを Encoding
オブジェクトで返します。
@see Encoding::UndefinedConversionError#source_encoding -
Encoding
:: US _ ASCII -> Encoding (36610.0) -
US-ASCII、いわゆる ASCII のことで、ISO 646 IRV と一致します。
US-ASCII、いわゆる ASCII のことで、ISO 646 IRV と一致します。
7bit の範囲のみを含み、8bit 目の立っている文字 (たとえば \x80 など) が含まれる場合は正しいエンコーディングであるとみなしません。 -
Encoding
:: UTF _ 7 -> Encoding (36607.0) -
UTF-7 です。
UTF-7 です。
7ビットの範囲内で表現される、Unicode のエンコーディングの一種です。
ダミーエンコーディングです。 -
Encoding
:: UTF _ 8 -> Encoding (36607.0) -
UTF-8。Unicode や ISO 10646 を ASCII 互換な形で符号化するための方式です。
UTF-8。Unicode や ISO 10646 を ASCII 互換な形で符号化するための方式です。
BOM を含みません。
@see https://tools.ietf.org/html/rfc3629 -
Encoding
:: InvalidByteSequenceError # destination _ encoding _ name -> String (36340.0) -
エラーを発生させた変換の変換先のエンコーディングを文字列で返します。
エラーを発生させた変換の変換先のエンコーディングを文字列で返します。
@see Encoding::InvalidByteSequenceError#destination_encoding -
Encoding
:: UndefinedConversionError # destination _ encoding _ name -> String (36340.0) -
エラーを発生させた変換の変換先のエンコーディングを文字列で返します。
エラーを発生させた変換の変換先のエンコーディングを文字列で返します。
@see Encoding::UndefinedConversionError#destination_encoding -
Encoding
:: IBM037 -> Encoding (36307.0) -
IBM037 エンコーディング。
IBM037 エンコーディング。
ダミーエンコーディングです。
@see https://en.wikipedia.org/wiki/EBCDIC_037 -
Encoding
# replicate(name) -> Encoding (27592.0) -
レシーバのエンコーディングを複製(replicate)します。 複製されたエンコーディングは元のエンコーディングと同じバイト構造を持たなければなりません。 name という名前のエンコーディングが既に存在する場合は ArgumentError を発生します。
レシーバのエンコーディングを複製(replicate)します。
複製されたエンコーディングは元のエンコーディングと同じバイト構造を持たなければなりません。
name という名前のエンコーディングが既に存在する場合は ArgumentError を発生します。
Ruby 3.2 から非推奨となり、Ruby 3.3 で削除予定です。
//emlist[][ruby]{
encoding = Encoding::UTF_8.replicate("REPLICATED_UTF-8") #=> #<Encoding:REPLICATED_UTF-8>
encoding.name ... -
OpenURI
:: Meta # content _ encoding -> [String] (27418.0) -
対象となるリソースの Content-Encoding を文字列の配列として返します。 Content-Encoding ヘッダがない場合は、空の配列を返します。
対象となるリソースの Content-Encoding を文字列の配列として返します。
Content-Encoding ヘッダがない場合は、空の配列を返します。
例:
//emlist[例][ruby]{
require 'open-uri'
open('http://example.com/f.tar.gz') {|f|
p f.content_encoding #=> ["x-gzip"]
}
//} -
Encoding
:: InvalidByteSequenceError # incomplete _ input? -> bool (27391.0) -
エラー発生時に入力文字列が不足している場合に真を返します。
エラー発生時に入力文字列が不足している場合に真を返します。
つまり、マルチバイト文字列の途中で文字列が終わっている場合に
真を返します。これは後続の入力を追加することでエラーが
解消する可能性があることを意味します。
//emlist[例][ruby]{
ec = Encoding::Converter.new("EUC-JP", "ISO-8859-1")
begin
ec.convert("abc\xA1z")
rescue Encoding::InvalidByteSequenceError
p $!
#=> #<Encoding::InvalidByteSequenc... -
CGI
:: QueryExtension # accept _ encoding -> String (27352.0) -
ENV['HTTP_ACCEPT_ENCODING'] を返します。
ENV['HTTP_ACCEPT_ENCODING'] を返します。 -
WEBrick
:: HTTPRequest # accept _ encoding -> [String] (27352.0) -
Accept-Encoding ヘッダの内容をコーディングを表す文字列の配列で返します。 配列は品質係数(qvalue)でソートされています。
Accept-Encoding ヘッダの内容をコーディングを表す文字列の配列で返します。
配列は品質係数(qvalue)でソートされています。 -
Encoding
:: Converter # putback -> String (27319.0) -
後の変換用に変換器内部で保持しているバイト列を max_numbytes で指定した バイト数だけ返します。max_numbytes を指定しなかった場合は保持しているバ イト列の全てを返します。
後の変換用に変換器内部で保持しているバイト列を max_numbytes で指定した
バイト数だけ返します。max_numbytes を指定しなかった場合は保持しているバ
イト列の全てを返します。
@param max_numbytes 取得するバイト列の最大値
@return 格納されていたバイト列
//emlist[][ruby]{
ec = Encoding::Converter.new("utf-16le", "iso-8859-1")
src = "\x00\xd8\x61\x00"
dst = ""
p ec.primitive_convert(src, dst) #=>... -
Encoding
:: Converter # putback(max _ numbytes) -> String (27319.0) -
後の変換用に変換器内部で保持しているバイト列を max_numbytes で指定した バイト数だけ返します。max_numbytes を指定しなかった場合は保持しているバ イト列の全てを返します。
後の変換用に変換器内部で保持しているバイト列を max_numbytes で指定した
バイト数だけ返します。max_numbytes を指定しなかった場合は保持しているバ
イト列の全てを返します。
@param max_numbytes 取得するバイト列の最大値
@return 格納されていたバイト列
//emlist[][ruby]{
ec = Encoding::Converter.new("utf-16le", "iso-8859-1")
src = "\x00\xd8\x61\x00"
dst = ""
p ec.primitive_convert(src, dst) #=>... -
WEBrick
:: HTTPRequest # query -> Hash (27319.0) -
リクエストのクエリーあるいはクライアントがフォームへ入力した値を表すハッシュを返します。
リクエストのクエリーあるいはクライアントがフォームへ入力した値を表すハッシュを返します。
ハッシュのキーも値も unescape されています。ただし multipart/form-data なフォームデータの場合には
ユーザが content-transfer-encoding ヘッダを見て適切に処理する必要があります。
ハッシュの値は正確には文字列ではなく String クラスのサブクラスである WEBrick::HTTPUtils::FormData
クラスのインスタンスです。
multipart/form-data なフォームデータであってもサイズの制限なく、通常のフォームデー... -
Encoding
:: UndefinedConversionError (27271.0) -
エンコーディング変換後の文字が存在しない場合に発生する例外。
エンコーディング変換後の文字が存在しない場合に発生する例外。
UTF-8 にしかない文字を EUC-JP に変換しようとした場合などに発生します。
//emlist[例][ruby]{
"\u2603".encode(Encoding::EUC_JP)
#=> Encoding::UndefinedConversionError: U+2603 from UTF-8 to EUC-JP
//}
変換が多段階でなされ、その途中で例外が生じた場合は、
例外オブジェクトが保持するエラー情報はその中間のものになります。
//emlist[例][ruby]{
ec = Encoding::Co... -
Encoding
:: InvalidByteSequenceError (27055.0) -
文字列がそのエンコーディングにおいて不正なバイト列である場合に発生 する例外。
文字列がそのエンコーディングにおいて不正なバイト列である場合に発生
する例外。
通常エンコーディング変換時に発生します。
//emlist[例][ruby]{
"\x82\xa0".force_encoding("cp932").encode("UTF-8")
#=> "あ"
"\x82\xa0".force_encoding("EUC-JP").encode("UTF-8")
#=> Encoding::InvalidByteSequenceError: "\x82" on EUC-JP
//} -
Encoding
:: ConverterNotFoundError (27019.0) -
指定した名前のエンコーディング変換をする変換器が 存在しない場合に発生する例外。
指定した名前のエンコーディング変換をする変換器が
存在しない場合に発生する例外。
//emlist[例][ruby]{
"あ".encode("Foo")
#=> Encoding::ConverterNotFoundError: code converter not found (UTF-8 to Foo)
//} -
String
# unpack(template) -> Array (18949.0) -
Array#pack で生成された文字列を テンプレート文字列 template にしたがってアンパックし、 それらの要素を含む配列を返します。
Array#pack で生成された文字列を
テンプレート文字列 template にしたがってアンパックし、
それらの要素を含む配列を返します。
@param template pack テンプレート文字列
@return オブジェクトの配列
以下にあげるものは、Array#pack、String#unpack
のテンプレート文字の一覧です。テンプレート文字は後に「長さ」を表す数字
を続けることができます。「長さ」の代わりに`*'とすることで「残り全て」
を表すこともできます。
長さの意味はテンプレート文字により異なりますが大抵、
"iiii"
のよう... -
String
# force _ encoding(encoding) -> self (18889.0) -
文字列の持つエンコーディング情報を指定された encoding に変えます。
文字列の持つエンコーディング情報を指定された encoding に変えます。
このとき実際のエンコーディングは変換されず、検査もされません。
Array#pack などで得られたバイト列のエンコーディングを指定する時に使います。
@param encoding 変更するエンコーディング情報を表す文字列か Encoding オブジェクトを指定します。
//emlist[例][ruby]{
s = [164, 164, 164, 237, 164, 207].pack("C*")
p s.encoding #=> ASC... -
Rubyの起動 (18775.0)
-
Rubyの起動 * cmd_option * shebang
Rubyの起動
* cmd_option
* shebang
Rubyインタプリタの起動は以下の書式のコマンドラインにより行います。
ruby [ option ...] [ -- ] [ programfile ] [ argument ...]
ここで、option は後述のcmd_option
のいずれかを指定します。-- は、オプション列の終りを明示するため
に使用できます。programfile は、Ruby スクリプトを記述したファイ
ルです。これを省略したり`-' を指定した場合には標準入力を Ruby ス
クリプトとみなします。
programfile が... -
Regexp
# fixed _ encoding? -> bool (18700.0) -
正規表現が任意の ASCII 互換エンコーディングとマッチ可能な時に false を返します。
正規表現が任意の ASCII 互換エンコーディングとマッチ可能な時に false を返します。
//emlist[例][ruby]{
# -*- coding:utf-8 -*-
r = /a/
r.fixed_encoding? # => false
r.encoding # => #<Encoding:US-ASCII>
r =~ "\u{6666} a" # => 2
r =~ "\xa1\... -
NKF
. # guess(str) -> Encoding (18658.0) -
文字列 str の漢字コードを推測して返します。
文字列 str の漢字コードを推測して返します。
返される値は、NKF モジュールのモジュール定数です。
返される値(すなわち、推測可能なエンコーディング)は以下のいずれかです。
* NKF::JIS
* NKF::EUC
* NKF::SJIS
* NKF::UNKNOWN
* NKF::UTF8
* NKF::UTF16
* Encoding::EUCJP_MS
* Encoding::CP51932
* Encoding::WINDOWS_31J
@param str 推測対象の文字列です。 -
IRB
:: MagicFile . ENCODING _ SPEC _ RE -> %r"coding\s*[=:]\s*([[:alnum:]\- _ ]+)" (18604.0) -
マジックコメントにマッチする正規表現を返します。
マジックコメントにマッチする正規表現を返します。 -
Kconv
. # guess(str) -> Encoding (18604.0) -
文字列 str のエンコーディングを判定します。戻り値は Kconv の定数です。
文字列 str のエンコーディングを判定します。戻り値は
Kconv の定数です。
このモジュール関数で判定できるのは、
* ISO-2022-JP (Kconv::JIS)
* Shift_JIS (Kconv::SJIS)
* EUC-JP (Kconv::EUC)
* ASCII (Kconv::ASCII)
* UTF-8 (Kconv::UTF8)
* UTF-16BE (Kconv::UTF16)
* 不明 (Kconv::UNKNOWN)
* 以上のどれでもない (Kconv::BINARY)
のいずれかです。
@param str エンコー... -
Kconv
:: EUC -> Encoding (18604.0) -
EUC-JP を表します。
EUC-JP を表します。 -
Kconv
:: UTF16 -> Encoding (18604.0) -
UTF16 を表します。
UTF16 を表します。 -
Kconv
:: UTF32 -> Encoding (18604.0) -
UTF32 を表します。
UTF32 を表します。 -
Kconv
:: UTF8 -> Encoding (18604.0) -
UTF8 を表します。
UTF8 を表します。 -
NKF
:: EUC -> Encoding (18604.0) -
EUC コードを表します。
EUC コードを表します。 -
NKF
:: UTF16 -> Encoding (18604.0) -
UTF-16 (BigEndian) コードを表します。
UTF-16 (BigEndian) コードを表します。 -
NKF
:: UTF32 -> Encoding (18604.0) -
UTF-32 (BigEndian) コードを表します。
UTF-32 (BigEndian) コードを表します。 -
NKF
:: UTF8 -> Encoding (18604.0) -
UTF-8 コードを表します。
UTF-8 コードを表します。 -
String
# scrub -> String (18499.0) -
self が不正なバイト列を含む場合に別の文字列に置き換えた新しい文字列を返します。
self が不正なバイト列を含む場合に別の文字列に置き換えた新しい文字列を返します。
@param repl 不正なバイト列を置き換える文字列を指定します。省略した場合
は self の文字エンコーディングが Encoding::UTF_16BE,
Encoding::UTF_16LE, Encoding::UTF_32BE,
Encoding::UTF_32LE, Encoding::UTF_8 のいずれか
の場合は "\uFFFD" を表す文字で、それ以外の場合は "?" で置き
... -
String
# scrub {|bytes| . . . } -> String (18499.0) -
self が不正なバイト列を含む場合に別の文字列に置き換えた新しい文字列を返します。
self が不正なバイト列を含む場合に別の文字列に置き換えた新しい文字列を返します。
@param repl 不正なバイト列を置き換える文字列を指定します。省略した場合
は self の文字エンコーディングが Encoding::UTF_16BE,
Encoding::UTF_16LE, Encoding::UTF_32BE,
Encoding::UTF_32LE, Encoding::UTF_8 のいずれか
の場合は "\uFFFD" を表す文字で、それ以外の場合は "?" で置き
... -
String
# scrub! -> String (18499.0) -
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
@param repl 不正なバイト列を置き換える文字列を指定します。省略した場合
は self の文字エンコーディングが Encoding::UTF_16BE,
Encoding::UTF_16LE, Encoding::UTF_32BE,
Encoding::UTF_32LE, Encoding::UTF_8 のいずれか
の場合は "\uFFFD" を表す文字で、それ以外の場合は "?" で置き
... -
String
# scrub! {|bytes| . . . } -> String (18499.0) -
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
@param repl 不正なバイト列を置き換える文字列を指定します。省略した場合
は self の文字エンコーディングが Encoding::UTF_16BE,
Encoding::UTF_16LE, Encoding::UTF_32BE,
Encoding::UTF_32LE, Encoding::UTF_8 のいずれか
の場合は "\uFFFD" を表す文字で、それ以外の場合は "?" で置き
... -
String
# scrub!(repl) -> String (18499.0) -
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
self が不正なバイト列を含む場合に別の文字列に置き換えます。常に self を返します。
@param repl 不正なバイト列を置き換える文字列を指定します。省略した場合
は self の文字エンコーディングが Encoding::UTF_16BE,
Encoding::UTF_16LE, Encoding::UTF_32BE,
Encoding::UTF_32LE, Encoding::UTF_8 のいずれか
の場合は "\uFFFD" を表す文字で、それ以外の場合は "?" で置き
...