開放、平等、協(xié)作、快速、分享
1、很久很久以前,Web 基本上就是文檔的瀏覽而已, 既然是瀏覽,作為服務器, 不需要記錄誰在某一段時間里都瀏覽了什么文檔,每次請求都是一個新的HTTP協(xié)議, 就是請求加響應, 尤其是我不用記住是誰剛剛發(fā)了HTTP請求, 每個請求對我來說都是全新的。這段時間很嗨皮
2、但是隨著交互式Web應用的興起,像在線購物網(wǎng)站,需要登錄的網(wǎng)站等等,馬上就面臨一個問題,那就是要管理會話,必須記住哪些人登錄系統(tǒng), 哪些人往自己的購物車中放商品, 也就是說我必須把每個人區(qū)分開,這就是一個不小的挑戰(zhàn),因為HTTP請求是無狀態(tài)的,所以想出的辦法就是給大家發(fā)一個會話標識(session id), 說白了就是一個隨機的字串,每個人收到的都不一樣, 每次大家向我發(fā)起HTTP請求的時候,把這個字符串給一并捎過來, 這樣我就能區(qū)分開誰是誰了
3、這樣大家很嗨皮了,可是服務器就不嗨皮了,每個人只需要保存自己的session id,而服務器要保存所有人的session id ! 如果訪問服務器多了, 就得由成千上萬,甚至幾十萬個。
這對服務器說是一個巨大的開銷 , 嚴重的限制了服務器擴展能力, 比如說我用兩個機器組成了一個集群, 小F通過機器A登錄了系統(tǒng), 那session id會保存在機器A上, 假設小F的下一次請求被轉發(fā)到機器B怎么辦? 機器B可沒有小F的 session id啊。
有時候會采用一點小伎倆: session sticky , 就是讓小F的請求一直粘連在機器A上, 但是這也不管用, 要是機器A掛掉了, 還得轉到機器B去。
那只好做session 的復制了, 把session id 在兩個機器之間搬來搬去, 快累死了。
后來有個叫Memcached的支了招: 把session id 集中存儲到一個地方, 所有的機器都來訪問這個地方的數(shù)據(jù), 這樣一來,就不用復制了, 但是增加了單點失敗的可能性, 要是那個負責session 的機器掛了, 所有人都得重新登錄一遍, 估計得被人罵死。
也嘗試把這個單點的機器也搞出集群,增加可靠性, 但不管如何, 這小小的session 對我來說是一個沉重的負擔
4 于是有人就一直在思考, 我為什么要保存這可惡的session呢, 只讓每個客戶端去保存該多好?
可是如果不保存這些session id , 怎么驗證客戶端發(fā)給我的session id 的確是我生成的呢? 如果不去驗證,我們都不知道他們是不是合法登錄的用戶, 那些不懷好意的家伙們就可以偽造session id , 為所欲為了。
嗯,對了,關鍵點就是驗證 !
比如說, 小F已經(jīng)登錄了系統(tǒng), 我給他發(fā)一個令牌(token), 里邊包含了小F的 user id, 下一次小F 再次通過Http 請求訪問我的時候, 把這個token 通過Http header 帶過來不就可以了。
不過這和session id沒有本質區(qū)別啊, 任何人都可以可以偽造, 所以我得想點兒辦法, 讓別人偽造不了。
那就對數(shù)據(jù)做一個簽名吧, 比如說我用HMAC-SHA256 算法,加上一個只有我才知道的密鑰, 對數(shù)據(jù)做一個簽名, 把這個簽名和數(shù)據(jù)一起作為token , 由于密鑰別人不知道, 就無法偽造token了。
這個token 我不保存, 當小F把這個token 給我發(fā)過來的時候,我再用同樣的HMAC-SHA256 算法和同樣的密鑰,對數(shù)據(jù)再計算一次簽名, 和token 中的簽名做個比較, 如果相同, 我就知道小F已經(jīng)登錄過了,并且可以直接取到小F的user id , 如果不相同, 數(shù)據(jù)部分肯定被人篡改過, 我就告訴發(fā)送者: 對不起,沒有認證。
Token 中的數(shù)據(jù)是明文保存的(雖然我會用Base64做下編碼, 但那不是加密), 還是可以被別人看到的, 所以我不能在其中保存像密碼這樣的敏感信息。
當然, 如果一個人的token 被別人偷走了, 那我也沒辦法, 我也會認為小偷就是合法用戶, 這其實和一個人的session id 被別人偷走是一樣的。
這樣一來, 我就不保存session id 了, 我只是生成token , 然后驗證token , 我用我的CPU計算時間獲取了我的session 存儲空間 !
解除了session id這個負擔, 可以說是無事一身輕, 我的機器集群現(xiàn)在可以輕松地做水平擴展, 用戶訪問量增大, 直接加機器就行。 這種無狀態(tài)的感覺實在是太好了!
cookie 是一個非常具體的東西,指的就是瀏覽器里面能永久存儲的一種數(shù)據(jù),僅僅是瀏覽器實現(xiàn)的一種數(shù)據(jù)存儲功能。
cookie由服務器生成,發(fā)送給瀏覽器,瀏覽器把cookie以kv形式保存到某個目錄下的文本文件內,下一次請求同一網(wǎng)站時會把該cookie發(fā)送給服務器。由于cookie是存在客戶端上的,所以瀏覽器加入了一些限制確保cookie不會被惡意使用,同時不會占據(jù)太多磁盤空間,所以每個域的cookie數(shù)量是有限的。
session 從字面上講,就是會話。這個就類似于你和一個人交談,你怎么知道當前和你交談的是張三而不是李四呢?對方肯定有某種特征(長相等)表明他就是張三。
session 也是類似的道理,服務器要知道當前發(fā)請求給自己的是誰。為了做這種區(qū)分,服務器就要給每個客戶端分配不同的“身份標識”,然后客戶端每次向服務器發(fā)請求的時候,都帶上這個“身份標識”,服務器就知道這個請求來自于誰了。至于客戶端怎么保存這個“身份標識”,可以有很多種方式,對于瀏覽器客戶端,大家都默認采用 cookie 的方式。
服務器使用session把用戶的信息臨時保存在了服務器上,用戶離開網(wǎng)站后session會被銷毀。這種用戶信息存儲方式相對cookie來說更安全,可是session有一個缺陷:如果web服務器做了負載均衡,那么下一個操作請求到了另一臺服務器的時候session會丟失。
在Web領域基于Token的身份驗證隨處可見。在大多數(shù)使用Web API的互聯(lián)網(wǎng)公司中,tokens 是多用戶下處理認證的最佳方式。
以下幾點特性會讓你在程序中使用基于Token的身份驗證
1.無狀態(tài)、可擴展
2.支持移動設備
3.跨程序調用
4.安全
那些使用基于Token的身份驗證的大佬們
大部分你見到過的API和Web應用都使用tokens。例如Facebook, Twitter, Google+, GitHub等。
Token的起源
在介紹基于Token的身份驗證的原理與優(yōu)勢之前,不妨先看看之前的認證都是怎么做的。
基于服務器的驗證
我們都是知道HTTP協(xié)議是無狀態(tài)的,這種無狀態(tài)意味著程序需要驗證每一次請求,從而辨別客戶端的身份。
在這之前,程序都是通過在服務端存儲的登錄信息來辨別請求的。這種方式一般都是通過存儲Session來完成。
下圖展示了基于服務器驗證的原理
隨著Web,應用程序,已經(jīng)移動端的興起,這種驗證的方式逐漸暴露出了問題。尤其是在可擴展性方面。
基于服務器驗證方式暴露的一些問題
1.Seesion:每次認證用戶發(fā)起請求時,服務器需要去創(chuàng)建一個記錄來存儲信息。當越來越多的用戶發(fā)請求時,內存的開銷也會不斷增加。
2.可擴展性:在服務端的內存中使用Seesion存儲登錄信息,伴隨而來的是可擴展性問題。
3.CORS(跨域資源共享):當我們需要讓數(shù)據(jù)跨多臺移動設備上使用時,跨域資源的共享會是一個讓人頭疼的問題。在使用Ajax抓取另一個域的資源,就可以會出現(xiàn)禁止請求的情況。
4.CSRF(跨站請求偽造):用戶在訪問銀行網(wǎng)站時,他們很容易受到跨站請求偽造的攻擊,并且能夠被利用其訪問其他的網(wǎng)站。
在這些問題中,可擴展行是最突出的。因此我們有必要去尋求一種更有行之有效的方法。
基于Token的驗證原理
基于Token的身份驗證是無狀態(tài)的,我們不將用戶信息存在服務器或Session中。
這種概念解決了在服務端存儲信息時的許多問題
NoSession意味著你的程序可以根據(jù)需要去增減機器,而不用去擔心用戶是否登錄。
基于Token的身份驗證的過程如下:
1.用戶通過用戶名和密碼發(fā)送請求。
2.程序驗證。
3.程序返回一個簽名的token 給客戶端。
4.客戶端儲存token,并且每次用于每次發(fā)送請求。
5.服務端驗證token并返回數(shù)據(jù)。
每一次請求都需要token。token應該在HTTP的頭部發(fā)送從而保證了Http請求無狀態(tài)。我們同樣通過設置服務器屬性Access-Control-Allow-Origin:* ,讓服務器能接受到來自所有域的請求。需要主要的是,在ACAO頭部標明(designating)*時,不得帶有像HTTP認證,客戶端SSL證書和cookies的證書。
實現(xiàn)思路:
1.用戶登錄校驗,校驗成功后就返回Token給客戶端。
2.客戶端收到數(shù)據(jù)后保存在客戶端
3.客戶端每次訪問API是攜帶Token到服務器端。
4.服務器端采用filter過濾器校驗。校驗成功則返回請求數(shù)據(jù),校驗失敗則返回錯誤碼
當我們在程序中認證了信息并取得token之后,我們便能通過這個Token做許多的事情。
我們甚至能基于創(chuàng)建一個基于權限的token傳給第三方應用程序,這些第三方程序能夠獲取到我們的數(shù)據(jù)(當然只有在我們允許的特定的token)
Tokens的優(yōu)勢
無狀態(tài)、可擴展
在客戶端存儲的Tokens是無狀態(tài)的,并且能夠被擴展?;谶@種無狀態(tài)和不存儲Session信息,負載負載均衡器能夠將用戶信息從一個服務傳到其他服務器上。
如果我們將已驗證的用戶的信息保存在Session中,則每次請求都需要用戶向已驗證的服務器發(fā)送驗證信息(稱為Session親和性)。用戶量大時,可能會造成
一些擁堵。
但是不要著急。使用tokens之后這些問題都迎刃而解,因為tokens自己hold住了用戶的驗證信息。
安全性
請求中發(fā)送token而不再是發(fā)送cookie能夠防止CSRF(跨站請求偽造)。即使在客戶端使用cookie存儲token,cookie也僅僅是一個存儲機制而不是用于認證。不將信息存儲在Session中,讓我們少了對session操作。
token是有時效的,一段時間之后用戶需要重新驗證。我們也不一定需要等到token自動失效,token有撤回的操作,通過token revocataion可以使一個特定的token或是一組有相同認證的token無效。
可擴展性()
Tokens能夠創(chuàng)建與其它程序共享權限的程序。例如,能將一個隨便的社交帳號和自己的大號(Fackbook或是Twitter)聯(lián)系起來。當通過服務登錄Twitter(我們將這個過程Buffer)時,我們可以將這些Buffer附到Twitter的數(shù)據(jù)流上(we are allowing Buffer to post to our Twitter stream)。
使用tokens時,可以提供可選的權限給第三方應用程序。當用戶想讓另一個應用程序訪問它們的數(shù)據(jù),我們可以通過建立自己的API,得出特殊權限的tokens。
多平臺跨域
我們提前先來談論一下CORS(跨域資源共享),對應用程序和服務進行擴展的時候,需要介入各種各種的設備和應用程序。
Having our API just serve data, we can also make the design choice to serve assets from a CDN. This eliminates the issues that CORS brings up after we set a quick header configuration for our application.
只要用戶有一個通過了驗證的token,數(shù)據(jù)和資源就能夠在任何域上被請求到。
Access-Control-Allow-Origin: *
基于標準
創(chuàng)建token的時候,你可以設定一些選項。我們在后續(xù)的文章中會進行更加詳盡的描述,但是標準的用法會在JSON Web Tokens體現(xiàn)。
最近的程序和文檔是供給JSON Web Tokens的。它支持眾多的語言。這意味在未來的使用中你可以真正的轉換你的認證機制。