
1: Anthyの品詞分類について。 2: 3: 4: Anthyでは品詞をwtype_tという型で扱う 5: wtype_tは 6: *品詞(名詞、動詞、、) 7: *副品詞(名詞における地名、人名、、などの分類) 8: *副副品詞(人名の姓名、数字の位など) 9: *活用クラス(5段、上一、サ変、、) 10: *活用形(未然、連用、、) 11: *副活用形(品詞、活用形が同じものを接続で分類する) 12: *オプション(自立語かどうか?連体形が名詞化するか?など) 13: の7つのパラメータを含んでいる。 14: 各パラメータはワイルドカードとして 15: 任意のものにマッチするものをとることができ、*であらわす。 16: この7つ組の組み合わせのうち、いくつかは文字列による名前を 17: 持っており、文法の定義の時などに使われる。 18: 例 19: "名詞" -名詞-*-*-*-*-*- 20: "動詞未然形D" -動詞-*-*-*-未然形-デフォルト- 21: 品詞の比較にはオプションを除く6つのパラメータを比較して 22: すべてのパラメータの対が等しい、もしくは比較の基準側がワイルドカード 23: であるときに対象側は基準側に含まれる。 24: 25: 26: include/wtype.hに CC_??として、活用のしかたを分類してある。 27: 活用表は最後の数文字を見て、語幹と活用形がわかればよいので、 28: 上一段と下一段は統合して扱う(本当はcannadicの都合)。 29: CC_NONE 無活用 30: CC_K5 か行5段 31: CC_C5 か行5段(行く or 逝く 「行った」という活用になる5段) 32: CC_G5 が行5段 33: CC_S5 さ行5段 34: CC_T5 た行5段 35: CC_N5 な行5段 36: CC_M5 ま行5段 37: CC_B5 ば行5段 38: CC_R5 ら行5段 39: CC_L5 ら行5段(命令形が 「イ」「いらっしゃい」「おっしゃい」「ござい」など) 40: CC_W5 わ行5段 41: CC_U5 乞う5段(「憩う」など、わ行とちがうのか?) 42: CC_KS1 上下1段 43: CC_KV か行変格 44: CC_SV さ行変格 45: CC_ZV さ行変格 46: CC_AJV 形容動詞 47: CC_A 形容詞 48: CC_A_U う音便の形容詞 49: 50: 51: 品詞(POS Part Of Speech)は以下のようなものが定義されている 52: POS_NONE 品詞不明 53: POS_NOUN (E)(entity) 体言(名詞、数詞、代名詞) 54: POS_PRT (P)(particle) 助詞 55: POS_XV (X)(auxiliary verb) 助動詞 56: POS_V (V)(verb)動詞 57: POS_A (A)(adjective)形容詞 58: POS_AJV (D)(adjective verb)形容動詞 59: POS_AV (B)(adverb)副詞 60: POS_ME (M)連体詞 61: POS_CONJ (C)(conjunction)接続詞 62: POS_IJ (I)(interjection) 感動詞 63: POS_PRE 一般名詞の接頭語 64: POS_SUC 一般名詞の接尾語 65: POS_INVAL 66: 67: 68: 副品詞 69: COS_NONE ワイルドカード 70: COS_CNPRE 地名の付属語 71: COS_NNPRE 数詞の付属語 72: 73: 74: 副副品詞 75: SCOS_NONE 76: SCOS_FAMNAME 氏 77: SCOS_FSTNAME 名 78: SCOS_T00 - SCOS_T39 79: 32種類 80: SCOS_T40(D2T35) 81: 動詞を名詞化させる接尾辞「(〜し)たて」 82: SCOS_T41(N2T35) 83: 名詞であると同時に名詞の接尾辞「〜用」 84: SCOS_A0 85: SCOS_A1 86: 87: 88: 活用形 89: CT_NONE 90: CT_SYUSI 91: CT_MIZEN 92: CT_RENYOU 93: CT_RENTAI 94: CT_MEIREI 95: CT_HEAD 語幹(形容詞、形容動詞のみ) 96: 97: 98: 副活用形 99: たとえば「動詞カ行5段未然形」は「書く」の場合には 100: 「書か(ない)」と「書こ(う)」の2つ存在して、 101: これらを区別するために副活用形を定義する。 102: 接続の種類ごとに分類しており、ある活用形でもっとも 103: 一般的と思われるものはデフォルトとしてあつかう。 104: 動詞未然形の場合は 105: デフォルト(CST_DEFAULT) 5段 サ変 以外 106: 「う」へ接続する5段 (CST_V_MIZEN_U) 107: 「ず」へ接続する5段 (CST_V_MIZEN_ZU) 108: 「し」 サ変 109: 「せ」 サ変 110: 「さ」 サ変 111: の6種に分類される。 112: デフォルトとワイルドカード 113: CST_NONE 114: CST_DEFAULT 115: 動詞の未然形に対応するもの 116: CST_V_MIZEN_U 書こ う 117: CST_V_MIZEN_ZU せ ず 118: CST_V_MIZEN_SI し サ変 119: CST_V_MIZEN_SE せ サ変 120: CST_V_MIZEN_SA さ サ変 121: (CST_DEFAULT) サ変 5段以外の未然形 122: 動詞の連用形に対応するもの 123: CST_V_RENYOU_5 書き ます 124: CST_V_RENYOU_TA 書い た 125: CST_V_RENYOU_DA 死ん だ 126: 動詞の終止形に対応するもの 127: 「たべよ」 とかいった文語的な命令 上下1、サ、カ変 128: CST_MEIRE_ 129: 形容詞連用形 130: CST_A_RENYOU_NA 白くない 131: 132: 133: オプション 134: WF_NONE なにも無し 135: WF_INDEP 独立語 136: WF_MEISI 連用形が名詞化する動詞 137: 138: 139: これらの他に、読みに対するフラグを用意している 140: F_NONE 141: NF_FAMNAME 142: NF_FSTNAME 143: NF_UNSPECNAME 144: NF_NAME 145: NF_NUM 146: NF_CNAME 147: SF_JN 148: SF_NUM