(linenum→info "unix/slp.c:2238")

anthy/9100e/doc/POS

    1: Anthyの品詞分類について。
    2: 
    3: 
    4: Anthyでは品詞をwtype_tという型で扱う
    5: wtype_tは
    6:  *品詞(名詞、動詞、、)
    7:  *副品詞(名詞における地名、人名、、などの分類)
    8:  *副副品詞(人名の姓名、数字の位など)
    9:  *活用クラス(5段、上一、サ変、、)
   10:  *活用形(未然、連用、、)
   11:  *副活用形(品詞、活用形が同じものを接続で分類する)
   12:  *オプション(自立語かどうか?連体形が名詞化するか?など)
   13: の7つのパラメータを含んでいる。
   14: 各パラメータはワイルドカードとして
   15: 任意のものにマッチするものをとることができ、*であらわす。
   16: この7つ組の組み合わせのうち、いくつかは文字列による名前を
   17: 持っており、文法の定義の時などに使われる。
   18: 
   19:  "名詞" -名詞-*-*-*-*-*-
   20:  "動詞未然形D" -動詞-*-*-*-未然形-デフォルト-
   21: 品詞の比較にはオプションを除く6つのパラメータを比較して
   22: すべてのパラメータの対が等しい、もしくは比較の基準側がワイルドカード
   23: であるときに対象側は基準側に含まれる。
   24: 
   25: 
   26: include/wtype.hに CC_??として、活用のしかたを分類してある。
   27: 活用表は最後の数文字を見て、語幹と活用形がわかればよいので、
   28: 上一段と下一段は統合して扱う(本当はcannadicの都合)。
   29:  CC_NONE 無活用
   30:  CC_K5 か行5段
   31:  CC_C5 か行5段(行く or 逝く 「行った」という活用になる5段)
   32:  CC_G5 が行5段
   33:  CC_S5 さ行5段
   34:  CC_T5 た行5段
   35:  CC_N5 な行5段
   36:  CC_M5 ま行5段
   37:  CC_B5 ば行5段
   38:  CC_R5 ら行5段
   39:  CC_L5 ら行5段(命令形が 「イ」「いらっしゃい」「おっしゃい」「ござい」など)
   40:  CC_W5 わ行5段
   41:  CC_U5 乞う5段(「憩う」など、わ行とちがうのか?)
   42:  CC_KS1 上下1段
   43:  CC_KV か行変格
   44:  CC_SV さ行変格
   45:  CC_ZV さ行変格
   46:  CC_AJV 形容動詞
   47:  CC_A 形容詞
   48:  CC_A_U う音便の形容詞
   49: 
   50: 
   51: 品詞(POS Part Of Speech)は以下のようなものが定義されている
   52:  POS_NONE 品詞不明
   53:  POS_NOUN (E)(entity) 体言(名詞、数詞、代名詞)
   54:  POS_PRT (P)(particle) 助詞
   55:  POS_XV (X)(auxiliary verb) 助動詞
   56:  POS_V (V)(verb)動詞
   57:  POS_A (A)(adjective)形容詞
   58:  POS_AJV (D)(adjective verb)形容動詞
   59:  POS_AV (B)(adverb)副詞
   60:  POS_ME (M)連体詞
   61:  POS_CONJ (C)(conjunction)接続詞
   62:  POS_IJ (I)(interjection) 感動詞
   63:  POS_PRE 一般名詞の接頭語
   64:  POS_SUC 一般名詞の接尾語
   65:  POS_INVAL
   66: 
   67: 
   68: 副品詞
   69:  COS_NONE ワイルドカード
   70:  COS_CNPRE 地名の付属語
   71:  COS_NNPRE 数詞の付属語
   72: 
   73: 
   74: 副副品詞
   75:  SCOS_NONE
   76:  SCOS_FAMNAME 氏
   77:  SCOS_FSTNAME 名
   78:  SCOS_T00 - SCOS_T39
   79:   32種類
   80:  SCOS_T40(D2T35)
   81:   動詞を名詞化させる接尾辞「(〜し)たて」
   82:  SCOS_T41(N2T35)
   83:   名詞であると同時に名詞の接尾辞「〜用」
   84:  SCOS_A0
   85:  SCOS_A1
   86: 
   87: 
   88: 活用形
   89:  CT_NONE
   90:  CT_SYUSI
   91:  CT_MIZEN
   92:  CT_RENYOU
   93:  CT_RENTAI
   94:  CT_MEIREI
   95:  CT_HEAD 語幹(形容詞、形容動詞のみ)
   96: 
   97: 
   98: 副活用形
   99: たとえば「動詞カ行5段未然形」は「書く」の場合には
  100: 「書か(ない)」と「書こ(う)」の2つ存在して、
  101: これらを区別するために副活用形を定義する。
  102: 接続の種類ごとに分類しており、ある活用形でもっとも
  103: 一般的と思われるものはデフォルトとしてあつかう。
  104: 動詞未然形の場合は
  105:  デフォルト(CST_DEFAULT) 5段 サ変 以外
  106:  「う」へ接続する5段 (CST_V_MIZEN_U)
  107:  「ず」へ接続する5段 (CST_V_MIZEN_ZU)
  108:  「し」 サ変
  109:  「せ」 サ変
  110:  「さ」 サ変
  111: の6種に分類される。
  112: デフォルトとワイルドカード
  113:  CST_NONE
  114:  CST_DEFAULT
  115: 動詞の未然形に対応するもの
  116:  CST_V_MIZEN_U 書こ う
  117:  CST_V_MIZEN_ZU せ ず
  118:  CST_V_MIZEN_SI し サ変
  119:  CST_V_MIZEN_SE せ サ変
  120:  CST_V_MIZEN_SA さ サ変
  121:  (CST_DEFAULT) サ変 5段以外の未然形
  122: 動詞の連用形に対応するもの
  123:  CST_V_RENYOU_5 書き ます
  124:  CST_V_RENYOU_TA 書い た
  125:  CST_V_RENYOU_DA 死ん だ
  126: 動詞の終止形に対応するもの
  127: 「たべよ」 とかいった文語的な命令 上下1、サ、カ変
  128:  CST_MEIRE_
  129: 形容詞連用形
  130:  CST_A_RENYOU_NA 白くない
  131: 
  132: 
  133: オプション
  134:  WF_NONE なにも無し
  135:  WF_INDEP 独立語
  136:  WF_MEISI 連用形が名詞化する動詞
  137: 
  138: 
  139: これらの他に、読みに対するフラグを用意している
  140:  F_NONE 
  141:  NF_FAMNAME
  142:  NF_FSTNAME
  143:  NF_UNSPECNAME
  144:  NF_NAME
  145:  NF_NUM
  146:  NF_CNAME
  147:  SF_JN
  148:  SF_NUM
Syntax (Markdown)