忍者ブログ
メモ帳です。それ以上でもそれ以下でもなくありたい。
21
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

「コーパス」とは「言語分析のための言語資料の集積」であるが、最近はコンピュータにより分析できる「コンピュータコーパス」「電子コーパス」の意味に用いられるのが普通である。

 本論では、英語解析ソフトを用いて「特殊目的コーパス」(大統領や首相の演説、英字新聞のスポーツ記事)と「汎用コーパス」(BNC)について、語の意味の比較分析を行う。私たちが実際に演説を聞いたり、記事を読んだりして受ける印象や解釈と、言語解析ソフトによる解析結果は同じ傾向なのかを調べる。

使用ソフトWordSmith Tools ver.3.0での語彙分析。
使用テキスト
2002年のブッシュ演説と同時期の小泉元首相演説

ブッシュ演説のキーワードourとterror(我々とテロ)
小泉演説のキーワードmeasures(対策)

マスコミでもしばしば指摘される我々(善)対敵(悪)の二元論を数字で証明できる。
対策を講じるといった、具体性に欠ける日本の演説が垣間見れる。

このように、語の分析ソフトは、私たちの直感を裏付ける。

次に、Wmatrixで、意味分析。
ブッシュ演説においては、「代名詞」「地名」を除き、アメリカが紛争にかかわっていることを示唆する意味群が抽出された。
小泉演説においては、「改革」「変化」などおなじみの小泉流を正しく捕らえている。

コーパス解析ソフトによる語や意味の解析結果の多くは、われわれが実際に聞いたり読んだりして受ける印象と相反しない。


スポーツ記事(Daily Yomiuriのスポーツ記事)と比較対象としてBNC(British National Corpus)を用いて、Wmatrixで解析を行う。
BNCと比較すると、当然のことながら意味う分析で「スポーツ」が抽出され、また試合結果に関する勝ち負けを表す語が多いということも、スポーツ記事の特徴として見られた。また、ゴルフ記事での語彙分析の結果、her、sheという語が多く、女性が他のスポーツ記事に比較し多く報じられていることがわかった。


直感を証明することに意義があり、また普通に読んでいるときには意識しない特徴的な語や意味分野に気づくことは、時として大きな意味を持つこととなる。

PR
お名前
タイトル
文字色
URL
コメント
パスワード
Vodafone絵文字 i-mode絵文字 Ezweb絵文字
Trackback URL
Copyright c メモ帳 All Rights Reserved
Powered by ニンジャブログ  Designed by ピンキー・ローン・ピッグ
忍者ブログ / [PR]