2016年4月22日 星期五

使用Netspeak來選英文上下文

英文作文時常會遇一些詞慣用的排列組合方式,如果可以知道大部分是怎樣使用,將有助於寫出不讓英語系國家人感到奇怪的文章。Netspeak這個網頁提供了種服務。總共有五種用法
  • ? 找一個單字,也可以用??找恰好兩個單字、???恰好三個單字
  • ... 找很多個單字,沒有指定剛好要幾個
  • [ ] 比較哪個單字比較常用
  • # 尋找相似的字
  • { } 檢查一組單字使用的順序

Netspeak也提供範例,列舉如下:
  • Find one word:  waiting ? response
  • Find two words:  waiting ?? response
  • Find any number of words:  waiting ... response
  • Find the best option:  the same [ like as ]
  • Find the best order:  { only for members }
  • Find the best synonym:  waiting * #response

除此以外,對於開發者來說,也可以用REST interface和Java API來與Netspeak做連結
所謂的REST interface是用網址去抓結果,例如說:
而Java API則是去叫REST介面來處理資料,並回傳JSON格式的資料。有興趣的可以到netspeak的developer網頁下載下面兩個檔案:

        Netspeak這個計畫是由Bauhaus-Universität Weimar大學裡面Computer Science and Media科系中Web Technology and Information Systems實驗室所維護,主持人是Prof. Dr. Benno Stein。Netspeak參考的文本是Web 1T 5-gram version 1,裡面包含了38億個長度最多是五個字的片語。詳細的狀況請參考這裡

        Netspeak搭配Google ngram(見之前的文章《使用Google Ngram Viewer》)對英文寫作很有幫助。首先可以先用Netspeak找出習慣使用的字或片語,再丟到Google ngram裡面看這些詞隨時間流行的程度。

_EOF_

沒有留言:

張貼留言