數(shù)字時(shí)代,數(shù)據(jù)共享互通成為剛需
數(shù)字經(jīng)濟(jì)時(shí)代,云計(jì)算、大數(shù)據(jù)、人工智能等新技術(shù)快速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式增長(zhǎng),數(shù)據(jù)類型變得愈發(fā)復(fù)雜多樣。在自動(dòng)駕駛、基因測(cè)序、氣象預(yù)報(bào)等云數(shù)智應(yīng)用場(chǎng)景中,一次數(shù)據(jù)處理可能會(huì)涉及到文件、對(duì)象、大數(shù)據(jù)等多種協(xié)議,數(shù)據(jù)間的互通轉(zhuǎn)換成為數(shù)據(jù)存儲(chǔ)中至關(guān)重要的一環(huán),具備平臺(tái)化能力的融合存儲(chǔ)成為數(shù)字基礎(chǔ)設(shè)施建設(shè)的核心。
以基因測(cè)序場(chǎng)景為例,一次完整的基因測(cè)序涉及到數(shù)據(jù)采集、格式化、脫敏、壓縮、分析、發(fā)布等操作,其過程可以大致分為樣本采集、DNA/RNA測(cè)序、數(shù)據(jù)分析和發(fā)布四個(gè)步驟。在不同的處理階段,需要使用不同的數(shù)據(jù)協(xié)議進(jìn)行操作。其中在樣本采集和DNA/RNA測(cè)序階段采用NFS文件協(xié)議,數(shù)據(jù)分析階段采用HDFS大數(shù)據(jù)協(xié)議,數(shù)據(jù)發(fā)布階段則是通過公網(wǎng)數(shù)據(jù)共享采用S3對(duì)象協(xié)議。整個(gè)數(shù)據(jù)處理過程涉及三種協(xié)議格式,這就意味著完成一次基因的測(cè)序流程需要在NFS、HDFS和S3之間進(jìn)行兩次數(shù)據(jù)拷貝和數(shù)據(jù)格式的轉(zhuǎn)換。傳統(tǒng)存儲(chǔ)僅支持單一的訪問協(xié)議,這就會(huì)造成兩個(gè)問題:一是數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)拷貝會(huì)降低整個(gè)數(shù)據(jù)處理流程的效率;二是多套存儲(chǔ)副本增加存儲(chǔ)空間成本。

基因測(cè)序應(yīng)用需要使用多種數(shù)據(jù)協(xié)議
百川入海:浪潮基于一套存儲(chǔ) 承載多樣化數(shù)據(jù)
浪潮分布式存儲(chǔ)平臺(tái)AS13000基于對(duì)非結(jié)構(gòu)化數(shù)據(jù)協(xié)議(NFS/CIFS/HDFS/S3)融合互通的研究進(jìn)行技術(shù)創(chuàng)新,采用統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理、統(tǒng)一的增值特性服務(wù)、統(tǒng)一的分布式存儲(chǔ)資源池和統(tǒng)一的管理軟件系統(tǒng),保證各種協(xié)議共享同一份數(shù)據(jù)和元數(shù)據(jù)。訪問過程中無需數(shù)據(jù)轉(zhuǎn)換和拷貝,并且為每種協(xié)議提供原生語義服務(wù),每種服務(wù)均可直接訪問,無需安裝網(wǎng)關(guān)、插件或在計(jì)算側(cè)或應(yīng)用層進(jìn)行改造。

AS13000非結(jié)構(gòu)化數(shù)據(jù)融合架構(gòu)
基于“多合一”極簡(jiǎn)架構(gòu),浪潮分布式存儲(chǔ)得以實(shí)現(xiàn)四個(gè)“統(tǒng)一”。
首先,提供統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理。
數(shù)據(jù)管理和元數(shù)據(jù)管理是非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的關(guān)鍵,浪潮分布式存儲(chǔ)平臺(tái)AS13000根據(jù)NFS、CIFS、HDFS和S3的語義和元數(shù)據(jù)特點(diǎn),抽象各協(xié)議的數(shù)據(jù)和元數(shù)據(jù)操作,通過一套統(tǒng)一的非結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)管理架構(gòu)有效地保證各協(xié)議的原生訪問。
其次,提供統(tǒng)一的增值特性服務(wù)。
基于統(tǒng)一的數(shù)據(jù)訪問接口和元數(shù)據(jù)管理的架構(gòu)設(shè)計(jì),浪潮AS13000對(duì)外提供統(tǒng)一的增值特性服務(wù),包括統(tǒng)一配額、QoS、加密、壓縮、快照、回收站、分級(jí)存儲(chǔ)、遠(yuǎn)程復(fù)制、元數(shù)據(jù)檢索等等。
以下圖為例:同一個(gè)元數(shù)據(jù)檢索服務(wù)ElasticSearch支持NFS、CIFS、S3、HDFS多種協(xié)議,并且各協(xié)議為同一配置入口和查詢?nèi)肟凇?/p>

統(tǒng)一增值特性示例:元數(shù)據(jù)檢索服務(wù)
再次,構(gòu)建統(tǒng)一的分布式存儲(chǔ)資源池。
AS13000支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議共享非結(jié)構(gòu)化存儲(chǔ)資源池,并且同一個(gè)文件不同協(xié)議訪問的數(shù)據(jù)和元數(shù)據(jù)為同一份。例如,通過文件NFS協(xié)議寫入的一個(gè)文件,通過對(duì)象存儲(chǔ)AWS S3協(xié)議、大數(shù)據(jù)HDFS協(xié)議和文件CIFS協(xié)議均可讀取;每個(gè)節(jié)點(diǎn)都可以啟動(dòng)文件NAS、大數(shù)據(jù)HDFS和對(duì)象存儲(chǔ)S3服務(wù)。
最后,打造統(tǒng)一的管理系統(tǒng)。
管理軟件負(fù)責(zé)集群的安裝、部署、業(yè)務(wù)配置、設(shè)備管理、監(jiān)控、告警等功能。浪潮分布式存儲(chǔ)平臺(tái)AS13000打造了融合互通的管理系統(tǒng),可同時(shí)支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議,增值特性通過統(tǒng)一的配置入口對(duì)所有非結(jié)構(gòu)化存儲(chǔ)協(xié)議同時(shí)生效,減少了企業(yè)的管理成本。
浪潮分布式存儲(chǔ)平臺(tái)AS13000通過多年來的持續(xù)技術(shù)創(chuàng)新,以一份數(shù)據(jù)支持多種協(xié)議訪問,實(shí)現(xiàn)了非結(jié)構(gòu)化數(shù)據(jù)融合互通,在提升數(shù)據(jù)處理效率的同時(shí)降低了存儲(chǔ)購置和運(yùn)維成本,保障各協(xié)議的語義無損和性能無損,構(gòu)筑了面向“云數(shù)智”應(yīng)用的融合存儲(chǔ)平臺(tái),助力企業(yè)數(shù)字化轉(zhuǎn)型,加速釋放數(shù)據(jù)價(jià)值。
(新媒體責(zé)編:wa12)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請(qǐng)?jiān)?0日內(nèi)進(jìn)行。電話:010-67683008
人民交通24小時(shí)值班手機(jī):17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計(jì) 地址:北京市豐臺(tái)區(qū)南三環(huán)東路6號(hào)A座四層
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證號(hào):京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號(hào) 京ICP備18014261號(hào)-2 廣播電視節(jié)目制作經(jīng)營(yíng)許可證:(京)字第16597號(hào)