A Big Data Framework for u-Healthcare Systems Utilizing Vital Signs Tae-Woong Kim, Kwang-Ho Park, Sang-Hoon Yi, Hee-Cheol Kim 2014 International Symposium on Computer, Consumer and Control(IS3C), Taichung, 10-12 June, pp. 494 – 497 報告者:曾彥志 報告日期:2015/03/29
Outline Introduction Big Data and Vital Signs Big Data platform for analysis of Vital Signs Implementation Conclusion
Introduction(1/2) 常見的保健習慣逐漸從治療轉向預防。 從預防和及早發現疾病,利用生物感應器預測和隨時隨地管理一個人的健康。 生命體徵分為兩種: 某一時間收集的資料 連續時間序列的資料 隨著通訊和感應器可穿戴式設備的進步,u型醫療保健系統有極大的潛力。 利用像是心電圖(ECG)、體溫及類似生物感應器的可穿戴式設備獲取生命體徵,預測和管理。 u型醫療保健系統利用可穿戴式設備獲取生物訊號,在用於儲存、處理及分析生命體徵,生命體徵分為兩種:一種是一個時間所測量的訊號,如體溫和血壓,另一種是連續的訊號,如呼吸和心電圖。
Introduction(2/2) 基於生命體徵的Big Data是龐大且不同的文本資料。 本文建議利用u型醫療保健系統框架擴展Hadoop平台。 需要利用演算法或是分析生物訊號去解釋原始資料。 此框架包含傳輸生物訊號資料、獲取特徵演算法、標準化的資料表達、在HDFS利用Map/Reduce做資料分析、提供一個開放平台和SOA(服務導向架構)服務。
Big Data and Vital Signs(1/6) 許多感應器獲取資料,包括RFID的使用也一直在擴大。 另外雲端運算的發展,可以收集各種資料,簡化收集和利用客戶的個人資料甚至是他們的購買過程。 因此在未來,Big data將成為企業、機構、社會必要的分析。
Big Data and Vital Signs(2/6) 而Big Data具有3V的特性: Volume(資料量) Velocity(時效性) Variety(多樣性) Veracity(可疑性) 毫無疑問的,生命體徵滿足3V的特性。 Volume(資料量): 資料量的大小 Velocity(時效性): 處理完成所需要的時間 Variety(多樣性): 要處理的資料格式種類 Veracity(可疑性): 資料本身的可靠度、品質是否足夠
Big Data and Vital Signs(3/6) 由各種生物感應器測量心電(ECG)、呼吸、血氧飽和度(SpO2)、血壓、體溫甚至是加速度。 生命體徵分為兩種: 某一時間收集的資料(結構化資料) 連續時間序列的資料(非結構化資料) 生命體徵分為兩種: 某一時間收集的資料(結構化資料),如體溫、血壓,可以儲存在資料庫中 連續時間序列的資料(非結構化資料),如心電、呼吸、SpO2,不適合儲存在資料庫中
Big Data and Vital Signs(4/6) 圖一顯示兩種生命體徵類型,收集在某一時刻的在左邊,如血壓;收集連續時間序列的在右邊,如心電圖。
Big Data and Vital Signs(5/6) 作為Big Data的Vital Signs 連續時間序列的生命體徵不僅是索引來瞭解一個人的健康,而是應該交由演算法來產生更有意義的指標。 整個框架必須包含特徵獲取演算法,然後獲取的特徵值可以記錄在資料庫中。
Big Data and Vital Signs(6/6) 但產生的問題是資料互操作性是不固定的,因為不同的資料庫具有不同的特性。 因此提出的框架是採用HL7標準化格式作為生命體徵的表示形式。 生物訊號時間序列是足夠龐大和非結構化的。 HL7(Health Level Seven,健康資訊交換第七層),有助於表達各種生物訊號的標準。 例如,當系統從一個人身上收集ECG訊號在240 Hz(每秒240)的資料,等於它收集了每小時864,000的資料。如果它從10000人身上收集這類資料,資料量就會非常巨大。
Big Data platform for analysis of Vital Signs(1/3) Hadoop可以使Big Data儲存在一個分散式的環境和並行處理多個伺服器叢集。 HDFS分配並儲存檔案,從Name Node分離Data Node,Map/Reduce作為子專案和程式設計模型。
Big Data platform for analysis of Vital Signs(2/3) Input先分割,在做Map,之後排序,在複製給output,進行合併,再Reduce(Map),產生副本。
Big Data platform for analysis of Vital Signs(3/3) 建議的平台增加了生命體徵、特徵儲存模型和SOA即時服務,從原始資料中獲取特徵值的演算法。 在此延伸的平台,有生命體徵資料和它們分析的結果與W3C開放標準傳送的SOAP訊息。 獲取的特徵值,如加速度資料,像是移動距離、步數、卡路里消耗量都被表示和儲存在基於HL7的中繼模型中。 SOAP的全名為Simple Object Access Protocol(簡易物件通訊協定),是一種以XML為基礎的通訊協定,其作用是編譯網路服務所需的要求或回應後,再將編譯後的訊息送出到網路,簡單來說就是應用程式和用戶之間傳輸資料的一種機制。
Implementation(1/6) 本文建議的框架,主要用加速度資料為主,利用連續時間序列收集生命體徵對u型醫療保健系統的實施。 Vital Signs的傳輸 當加速度資料從智慧型手機傳輸到伺服器時,框架會支援不同設備之間的互操作性,透過W3C RPC(遠端程序呼叫)發送資料。 遠端程序呼叫,如SOAP訊息。
Implementation(2/6) 特徵獲取演算法 加速度資料由X,Y,Z三個軸的值組成,系統可以檢測一個人的運動和使用這些值的步驟。 在這項研究中,使用演算法來檢測步數、移動距離和卡路里消耗量等。 演算法獲取原始的加速度資料,再將特徵值傳送給基於HL7的特徵值轉換模組。
Implementation(3/6) Vital Signs的儲存模型 對於互操作性,透過演算法從原始資料中獲取的值是一個延伸的HL7 aECG格式,其中包含語意資訊。 原始資料以XML形式被單獨儲存在由Hadoop提供的HDFS中。
Implementation(4/6) 分析模型 基於HL7的XML文件被應用在工作中,這意味著系統需要XML的解析,Hadoop基本上提供Map/Reduce做編程文字挖掘。 框架支援Key和Value,Map用於獲取特徵值,如大量的距離、熱量、卡路里消耗量。 框架也被設計成計算Map的Key和Value值提供所需的各種服務。
Implementation(5/6)
Implementation(6/6) 服務模型 透過Map/Reduce提供的結果值,通過SOA轉化成SOAP訊息並且發送到用戶端程式或終端。 這裡SOA是一個開放標準平台,使用W3C標準的SOAP訊息,呼叫和分析異質設備之間的物件,獨立於各種終端或是作業系統。 當SOAP訊息被分析時,用戶端程式獲取的服務會收到分析的結果,從加速度資料中獲得卡路里的消耗量、移動距離、步數及運動的時間。
Conclusion(2/2) 生物訊號是一個決定性的指標來判斷一個人的健康,然而由於感應器和供應商的依賴,現有技術的儲存和分析生命體徵出現一個問題,因為每個廠商的產品都有自己獨特的特性,這意味著缺乏標準化和有關醫療保健系統的互通性和系統集成。 此外,目前對於生命體徵的儲存設計進行的非常糟糕,這會導致性能降低和系統的不可靠性。
Conclusion(2/2) 針對這些問題,提出的框架,採用基本的Hadoop結構並擴展它,此它適合處理生物訊號,透過設計的生命體徵資料傳輸到伺服器上擷取特徵值,以及擴展資料表示模型和即時服務的方法,提供標準化的服務,以確保互通性。 此外透過與Big Data挖掘技術相結合,可提供高品質的醫療保健服務,包括運動管理、慢性病管理和預防疾病。