Presentation is loading. Please wait.

Presentation is loading. Please wait.

以開放原始碼建立一個具錯別字修正能力之 網路新興辭彙資訊處理系統

Similar presentations


Presentation on theme: "以開放原始碼建立一個具錯別字修正能力之 網路新興辭彙資訊處理系統"— Presentation transcript:

1 以開放原始碼建立一個具錯別字修正能力之 網路新興辭彙資訊處理系統
4A1G0021 蔡映輝 4A1G0024 黃詠煒 4A1G0086 陳博偉

2 目的 本文件主要提供具錯別字修正能力之網路新興 詞彙資訊處理系統的需求說明,本文件主要依 據Object-Oriented Software Engineering 的Domain Analysis [1]來編排,並依循Capability Maturity Model-Integrated (CMMI) V1.2 [2]中Require Development (RD) ProcessArea 所規範的需求發展 方法來發展,以期能達到本專案的開發目的。

3 網路新興詞彙系統Server 配備 OS 平臺:Linux Fedora Core 3
Server 硬體:Intel Celeron 1.1G 處理器、256MB RAM 軟體元件:Apache、MySQL、Perl

4 個子系統作業系統、資料庫與程式環境 Linux 作業系統 MySQL 資料庫系統 Perl 程式語言

5 具錯別字修正能力之網路新興詞彙資訊處理系統各子系統
網頁抓取代理人子系統 網頁標籤移除代理人子系統 斷詞子系統 詞彙比對子系統 詞彙庫建立子系統 詞彙修正建議子系統 使用者介面子系統子系統

6 具錯別字修正能力之網路新興詞彙資訊處理系統架構圖

7 系統整合測試程序

8 新興詞彙資訊處理步驟

9 操作概念 本系統允許使用者在網頁介面上貼入一篇文字,由系統判讀檢查出哪 些為新興詞彙並得以在運作後注釋出已知新興詞彙之意思。

10 網頁抓取代理人子系統 本子系統主要提供系統需要向網路抓取面之服務。透過Perl 程式之網 頁介面可以達成模組功能 網頁抓取代理人子系統架構圖
網頁抓取代理人子系統之頁面處理結果

11 網頁標籤移除代理人子系統 本子系統主要提供出網頁標籤移除作業,藉由使用者介面UIS 呼叫網 頁標籤移除代理人子系統TRA,完成系統所需的標籤移除功能。 網頁標籤移除代理人子系統架構圖 網頁標籤移除代理人子系統之頁面處理結果

12 斷詞子系統 本子系統主要提供斷詞作業,將網頁標籤移除後或使用者貼入之純文 字文件以系統選定斷詞策略進行斷詞以利後續詞彙比對工作之進行。
斷詞子系統之頁面處理結果 斷詞子系統架構圖

13 詞彙比對子系統 本子系統主要提供詞彙比對作業,在特定文件中尋找與比對網路新興 詞彙,一方面準備將詞彙列入統計一方面將可能是未收錄的新興詞彙 列入使用者確認名單以加入新興詞彙庫內。 詞彙比對子系統之頁面處理結果 詞彙比對子系統架構圖

14 詞彙庫建立子系統 本子系統主要提供詞彙庫建立作業,在WPM 詞彙比對後,可隨詞彙 性質是否為新詞彙而由使用者透過UIS 決定是否建立於新興詞彙庫。 詞彙庫建立子系統之頁面處理結果 詞彙庫建立系統架構圖

15 詞彙修正建議子系統 本子系統主要提供詞彙修正建議作業,系統功能在使用者貼上之文件 或經網頁抓取、斷詞後內容找到新興詞彙或錯別字,在詞彙後加上注 釋或修正建議。 詞彙修正建議子系統之頁面處理結果 詞彙修正建議子系統架構圖

16 使用者介面子系統 本子系統主要提供使用者介面子系統作業,讓使用者呼叫各子功能模 組達成DCS 完整系統功能之服務。
使用者介面子系統資訊處理頁面 使用者介面子系統架構

17 分工結構圖

18 預定時程及查核點 預訂查核點說明 預定時程→

19 資源需求

20 資料管理規劃 資料管理計畫 本計畫資料管理與儲存方式將分為五種:
(1) 原始程式碼:所有的原始程式碼使用一台Linux主機上面的CVS伺服器進行 管理, Client端則使用wincvs來進行簽入與簽出。並由本專案負責建構管理人 員每月進行一次備份動作,將程式碼由部門Linux主機上複製一份到檔案伺服 器。註:每當本專案所有的程式碼要建立基準時,負責「建構管理」工作的 人員負責把所要建立的基準從CVS伺服器上複製一份到檔案伺服器上,並壓 成一個壓縮檔,接下來再依CM程序進行建構管理。 (2) 電子文件及可執行檔:原始程式碼以外的電子文件或可執行檔案,使用檔 案伺服器中個人的網路硬碟帳號進行管理,並本專案的負責人每一個月進行 一次備份動作,保留最近四個月內的備份。 (3) 與計畫相關之電子郵件:統一在信件主旨最前面加上一致的標籤(例 如:[DCS]),再同時CC給本專案的資料管理人員(建構管理人員支援資料管理)負 責保管。 (4) 纸本文件或光碟資料:由本專案的資料管理人員負責保管。 (5) 由各自系統負責的人員管理。

21 列管資料總表

22 風險評估


Download ppt "以開放原始碼建立一個具錯別字修正能力之 網路新興辭彙資訊處理系統"

Similar presentations


Ads by Google