亞馬遜Web服務(wù)近年來頻繁變動,從價格削減到緊密整合私有數(shù)據(jù)中心,再到調(diào)整企業(yè)市場,而且不斷擴展其原來的開發(fā)者和創(chuàng)業(yè)公司客戶。
在眾多執(zhí)行者中一馬當(dāng)先的就是Matt Wood,他是亞馬遜Web服務(wù)(AWS)的數(shù)據(jù)科學(xué)總經(jīng)理。SearchCloudComputing本周在AWS峰會上和他探討了企業(yè)客戶的熱點問題。這里我們將談?wù)勗苾r格、云聯(lián)盟、法規(guī)以及數(shù)據(jù)定位。
TechTarget云計算:云價格是當(dāng)下的熱點話題,谷歌和亞馬遜都在本周大幅降價。在每個人都可以免費得到一切之前價格究竟會有多低?
Matt Wood:我們一直都知道, 和我們的零售業(yè)務(wù)有一點像,云計算是一種大容量、低利潤的游戲,而且這是一種我們非常適應(yīng)的業(yè)務(wù)模式。
如果你回顧過去的八年,我們降價42次,這樣做并沒有任何真正的競爭壓力。降價只是我們所做的一部分,是我們的組織發(fā)展的脈搏的而一部分,而且我們處于良性循環(huán)中……有越多客戶采納這個平臺的地方,他們就使用得更多,而且因為我們能走出去和我們的廠商進行客制交易,我們走出去,并且利用規(guī)模經(jīng)濟,總體上我們最終是節(jié)省了成本。我們還可以從中獲利。這也是一種合情合理的事情。但是我們選擇將這些成本節(jié)省回饋給客戶……我們一直在做這些事情,而且未來我們還會這樣做。
TechTarget云計算:你的專長領(lǐng)域是數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析。在這個領(lǐng)域里你是否看到了一些新的趨勢?
Wood: 最大的趨勢之一就是增益,而非取代,但是傳統(tǒng)商業(yè)智能的增益則伴隨更加實時的服務(wù)。而且是二者同時變得更加強大。
芬蘭游戲公司Supercell就是個很好的例子……他們運作流行移動游戲,比如部落戰(zhàn)爭(COC),而且他們一天中有八百萬人在ios上玩這個游戲。理想上,如果你是個游戲公司,你希望盡可能地捕捉價值。你想知道人們?nèi)绾瓮螒蚴澜缃换。你想知道你的游戲競技表現(xiàn)如何。你想知道誰買了什么,以及誰和誰進行了對話,在什么情況下退出了游戲。你可以利用這些信息改善游戲。
通過收集所有數(shù)據(jù)有些已經(jīng)實現(xiàn)了。你收集什么并沒有限制,使用亞馬遜實施管理流服務(wù)Kinesis,就是一種實現(xiàn)途徑,你可以將數(shù)據(jù)丟進去,并且以不同的樣本率連接傳感器,,用同樣的數(shù)據(jù)流可以做不同的事情。
TechTarget云計算:亞馬遜將自己描述為“客戶導(dǎo)向”。那么哪些特性和服務(wù)是客戶目前尋求的呢?
Wood:他們會詢問類似這樣的事情,‘是否易于訪問高價值、公共數(shù)據(jù)集?’這就要求我們要做很多。因為有很多數(shù)據(jù)。我們花費大量的時間識別,且同公共的可用數(shù)據(jù)工作,并且使其易于使用。
Common Crawl就是個很好的例子,它會定期更新,是一個非常大的Web集,Web上的每一頁、下載和預(yù)計算,放到一個主頁上,這就讓Hadoop很容易運行。你不必自己來抓取,必須將原素材進行預(yù)計算所有的標簽,并且移除HTML和類似的東西,這些都已經(jīng)做好了。
你所得到的就是格式化的數(shù)據(jù),易于用分布式的方式使用。你可以在冷啟動中在不到十分鐘的時間里查詢數(shù)十億網(wǎng)頁。我們存儲且托管這個數(shù)據(jù)是免費的,因為對于整個社區(qū)是有益的,然后我們確保其遵循了最佳的簡單對象存儲(S3)訪問實踐,所以這也很容易加速大型Hadoop集群,并且運行查詢。
TechTarget云計算:我們接觸的一些客戶認為云聯(lián)盟很有前途,亞馬遜如何看待這個問題呢?
Wood: 我們目前還沒從客戶那里聽到這樣的說法,但是這并不代表未來這不重要。
我們從一些更大企業(yè)機構(gòu)那里聽到就是已經(jīng)在基礎(chǔ)架構(gòu)上進行了大量投資。他們已經(jīng)有了藍圖。我們和這些人談?wù)摰臅r候,我們嘗試引導(dǎo)他們并非一種選擇,可以本地運行或者是在AWS上運行一切。
我們過去的十八個月都在構(gòu)建集成點,使其更易于讓用戶在有意義的地方運行工作負載。我們在他們的數(shù)據(jù)中心和我們的數(shù)據(jù)中心之間構(gòu)建了直接的鏈接,我們提供私有存儲選擇,我們也有私有計算選擇,我們識別了聯(lián)合選擇以及類似于WorkSpaces這樣的事物,這是一種在后端同活動目錄集成的事物。所有的這些集成點都幫助客戶在其工作負載上做出正確的選擇。
TechTarget云計算:一些客戶處于法規(guī)遵從原因需要將數(shù)據(jù)保存在某個特性區(qū)域,亞馬遜能夠簽署法定協(xié)議,保證客戶的數(shù)據(jù)不會離開具體的可用區(qū)或者具體的區(qū)域嗎?
Wood: 實際上,你如果不選擇數(shù)據(jù)存在哪里是沒辦法使用我們的平臺的?蛻舯仨氉龀鲋斏鞯臎Q定,確定其數(shù)據(jù)將會存在的區(qū)域。我們有這樣的特定區(qū)域,每一個區(qū)域都有多種可用區(qū),而且可用區(qū)內(nèi)部都有數(shù)據(jù)中心。以S3服務(wù)為例,我們通過可用去得到鏡像數(shù)據(jù),但是我們不會在區(qū)域間做鏡像數(shù)據(jù)。