亞馬遜Web服務近年來頻繁變動,從價格削減到緊密整合私有數(shù)據(jù)中心,再到調整企業(yè)市場,而且不斷擴展其原來的開發(fā)者和創(chuàng)業(yè)公司客戶。
在眾多執(zhí)行者中一馬當先的就是Matt Wood,他是亞馬遜Web服務(AWS)的數(shù)據(jù)科學總經理。SearchCloudComputing本周在AWS峰會上和他探討了企業(yè)客戶的熱點問題。這里我們將談談云價格、云聯(lián)盟、法規(guī)以及數(shù)據(jù)定位。
TechTarget云計算:云價格是當下的熱點話題,谷歌和亞馬遜都在本周大幅降價。在每個人都可以免費得到一切之前價格究竟會有多低?
Matt Wood:我們一直都知道, 和我們的零售業(yè)務有一點像,云計算是一種大容量、低利潤的游戲,而且這是一種我們非常適應的業(yè)務模式。
如果你回顧過去的八年,我們降價42次,這樣做并沒有任何真正的競爭壓力。降價只是我們所做的一部分,是我們的組織發(fā)展的脈搏的而一部分,而且我們處于良性循環(huán)中……有越多客戶采納這個平臺的地方,他們就使用得更多,而且因為我們能走出去和我們的廠商進行客制交易,我們走出去,并且利用規(guī)模經濟,總體上我們最終是節(jié)省了成本。我們還可以從中獲利。這也是一種合情合理的事情。但是我們選擇將這些成本節(jié)省回饋給客戶……我們一直在做這些事情,而且未來我們還會這樣做。
TechTarget云計算:你的專長領域是數(shù)據(jù)科學和大數(shù)據(jù)分析。在這個領域里你是否看到了一些新的趨勢?
Wood: 最大的趨勢之一就是增益,而非取代,但是傳統(tǒng)商業(yè)智能的增益則伴隨更加實時的服務。而且是二者同時變得更加強大。
芬蘭游戲公司Supercell就是個很好的例子……他們運作流行移動游戲,比如部落戰(zhàn)爭(COC),而且他們一天中有八百萬人在ios上玩這個游戲。理想上,如果你是個游戲公司,你希望盡可能地捕捉價值。你想知道人們如何同游戲世界交互。你想知道你的游戲競技表現(xiàn)如何。你想知道誰買了什么,以及誰和誰進行了對話,在什么情況下退出了游戲。你可以利用這些信息改善游戲。
通過收集所有數(shù)據(jù)有些已經實現(xiàn)了。你收集什么并沒有限制,使用亞馬遜實施管理流服務Kinesis,就是一種實現(xiàn)途徑,你可以將數(shù)據(jù)丟進去,并且以不同的樣本率連接傳感器,,用同樣的數(shù)據(jù)流可以做不同的事情。
TechTarget云計算:亞馬遜將自己描述為“客戶導向”。那么哪些特性和服務是客戶目前尋求的呢?
Wood:他們會詢問類似這樣的事情,‘是否易于訪問高價值、公共數(shù)據(jù)集?’這就要求我們要做很多。因為有很多數(shù)據(jù)。我們花費大量的時間識別,且同公共的可用數(shù)據(jù)工作,并且使其易于使用。
Common Crawl就是個很好的例子,它會定期更新,是一個非常大的Web集,Web上的每一頁、下載和預計算,放到一個主頁上,這就讓Hadoop很容易運行。你不必自己來抓取,必須將原素材進行預計算所有的標簽,并且移除HTML和類似的東西,這些都已經做好了。
你所得到的就是格式化的數(shù)據(jù),易于用分布式的方式使用。你可以在冷啟動中在不到十分鐘的時間里查詢數(shù)十億網頁。我們存儲且托管這個數(shù)據(jù)是免費的,因為對于整個社區(qū)是有益的,然后我們確保其遵循了最佳的簡單對象存儲(S3)訪問實踐,所以這也很容易加速大型Hadoop集群,并且運行查詢。
TechTarget云計算:我們接觸的一些客戶認為云聯(lián)盟很有前途,亞馬遜如何看待這個問題呢?
Wood: 我們目前還沒從客戶那里聽到這樣的說法,但是這并不代表未來這不重要。
我們從一些更大企業(yè)機構那里聽到就是已經在基礎架構上進行了大量投資。他們已經有了藍圖。我們和這些人談論的時候,我們嘗試引導他們并非一種選擇,可以本地運行或者是在AWS上運行一切。
我們過去的十八個月都在構建集成點,使其更易于讓用戶在有意義的地方運行工作負載。我們在他們的數(shù)據(jù)中心和我們的數(shù)據(jù)中心之間構建了直接的鏈接,我們提供私有存儲選擇,我們也有私有計算選擇,我們識別了聯(lián)合選擇以及類似于WorkSpaces這樣的事物,這是一種在后端同活動目錄集成的事物。所有的這些集成點都幫助客戶在其工作負載上做出正確的選擇。
TechTarget云計算:一些客戶處于法規(guī)遵從原因需要將數(shù)據(jù)保存在某個特性區(qū)域,亞馬遜能夠簽署法定協(xié)議,保證客戶的數(shù)據(jù)不會離開具體的可用區(qū)或者具體的區(qū)域嗎?
Wood: 實際上,你如果不選擇數(shù)據(jù)存在哪里是沒辦法使用我們的平臺的?蛻舯仨氉龀鲋斏鞯臎Q定,確定其數(shù)據(jù)將會存在的區(qū)域。我們有這樣的特定區(qū)域,每一個區(qū)域都有多種可用區(qū),而且可用區(qū)內部都有數(shù)據(jù)中心。以S3服務為例,我們通過可用去得到鏡像數(shù)據(jù),但是我們不會在區(qū)域間做鏡像數(shù)據(jù)。