📜 [專欄新文章] Unirep介紹: 使用ZKP的評價系統
✍️ Ya-Wen Jeng
📥 歡迎投稿: https://medium.com/taipei-ethereum-meetup #徵技術分享文 #使用心得 #教學文 #medium
Unirep是什麼? 怎麼用?
Photo by Raphael Lovaski on Unsplash
UniRep 是一個使用零知識證明(Zero-knowledge Proof)而達到具有隱私保障的評價 (reputation) 系統。使用者有權利享有多個暫時性的身份,但又同時能提出證明,讓其他人可以驗證評價是否符合自己宣稱的數量。此外,使用者也無法拒絕接收對自己不利的評價。
想像一個情境:如果Alice是Airbnb的使用者,Alice常常透過Airbnb租房,且Alice曾經獲得獲得許多Airbnb房東的好評;有一天Alice想透過Booking.com訂房,http://xn--alicebooking-kt4so6lvyab96x7trhi5b54x.com/,所以在Booking.com上沒有任何評價,萬一Booking.com的房東不想把房子租給來路不明的客人,那Alice要如何向Booking.com的房東證明她其實都是用Airbnb租房,且獲得許多好評?
Alice雖然可以透過截圖或公開自己的資訊向Booking.com的房東證明自己擁有這些好評,但這樣Alice的隱私或許會被洩漏,例如Alice不想讓Booking.com的房東知道自己去過哪些地方、住過哪些民宿;或者Alice有可能偽造截圖,或者偽造評價,那Booking.com的房東要如何相信Alice所提供的證明文件是真的來自Airbnb的房東?除此之外有沒有更彈性的方式,Alice可以選擇性地向Booking.com的房東證明,自己至少有10個好評,但不透露自己總共有多少好評?
Photo by Andrea Davis on Unsplash
使用Unirep協定就可以解決這個問題。UniRep 取名自 Universal Reputation,希望透過區塊鏈上智能合約的可互用性 (interoperable,指智能合約容易被多方呼叫且容易透過智能合約與對方互動),讓不管是Airbnb的房東、Booking.com的房東或是Alice都能很容易地透過Unirep的智能合約與對方互動,且透過零知識證明的方式,讓Alice的評價具有隱私的保障,Alice不用明確地向Booking.com的房東說這些評價是怎麼獲得、是什麼時候獲得,也可以彈性的證明自己至少有多少好評,或者最多有多少差評。
密碼學
Unirep主要用到的密碼學方法有
雜湊函數 hash:若有一個雜湊函數 f(x) = y 則由x可以很輕易的用f算出y,但從y推回x是幾乎不可能的,且要找到兩個不同的x對應到相同的y也是幾乎不可能的(沒有碰撞問題)。
零知識證明 zero-knowledge proof:可以將複雜的運算邏輯轉成容易驗證且具有隱私保障的驗證問題,使用者只要將變數輸入,這個零知識證明的演算法就會產生對應的證明且計算出對應的結果,使用者只要將此證明和運算結果輸入驗證的程序中,其他人就能驗證使用者是不是提出正確的證明,若驗證成功,則驗證者就能相信提出證明者高機率擁有正確的知識,也就是在計算證明時的輸入變數。
ZKP Proof System
ZKP Verification System
Semaphore:semaphore 是設計為可以用零知識證明驗證的身份認證系統。Unirep 中用來產生私鑰 (identity) 和公鑰的 hash 值(identity commitment),讓使用者不必公開 identity 仍能透過零知識證明驗證其公私鑰的對應性。
雜湊樹 Merkle trees:Unirep 中大量運用雜湊樹的方式確保評價紀錄,而其中用到的雜湊樹又分兩種:Incremental merkle tree 和 Sparse merkle tree
Incremental merkle tree: 從 index 0 開始依序插入雜湊樹中的樹葉。為了使 ZKP 的 circuit 大小固定, Unirep 中使用固定高度的 Incremental merkle tree。
Sparse merkle tree: 在特定的 index i 插入樹葉
Incremental merkle tree and sparse merkle tree
UniRep中用到的名詞定義
Epoch
指一段特定的時間,例如7天
UniRep 的 Epoch 從 1 開始計算,7天過後Epoch數加一,即 Epoch 變為 2
Epoch Key
每個使用者在每個 Epoch 都能產生 n 把 Epoch key,用來收取評價 epoch_key = hash (id, epoch, nonce)
id: 這裡指用 semaphore 產生的 identity
epoch: 表示這是在第幾個 epoch 產生的 epoch key
nonce: 若 Unirep 規定使用者能在一個 epoch 產生 5 把 epoch key,則使用者可以選從 0 到 4 為此 nonce
因為雜湊函數的性質,算出來的 epoch key 很難推回原本的 id, epoch, nonce, 所以看到 epoch key 並不能推回使用者是誰。
以Alice為例,當Alice住完Airbnb,房東會透過 epoch key 給予 Alice 評價,但房東無法知道 Alice 在同個 epoch 的其他 epoch key 是哪一把,也無法知道 Alice 在別的 epoch 獲得的評價,除非 Alice 在這個 epoch 重複使用同一把 epoch key 收取評價。
User 使用者
用 semaphore 產生 identity 並使用此 identity 註冊的使用者
使用者是接收評價、證明評價、或是花費評價的人,用 epoch key 跟其他人互動,因為 epoch key 會隨著 epoch 增加而改變,所以對使用者來說每個 epoch 能產生的 epoch key 都不同,具有保護隱私的效果。
在上面的例子中使用者指的是 Alice, Bob, Airbnb 的房東, Booking.com的房東
Attester 證人
用 Ethereum address 或 smart contract address 註冊的用戶
是會被使用者記錄下來的評價給予者
Unirep 會給這些 address 一個 attester ID,而這個 attester ID 不會隨著 epoch 增加而改變,使用者可以知道這個評價是來自哪一個 attester。
在上面的例子中指的是 Airbnb 跟 Booking.com,因為 attester ID 不變,所以使用者可以證明這些評價是來自於 Airbnb 或是 Booking.com
User State Tree (UST)
是一 Sparse merkle tree
每個使用者都有自己的 User State Tree,其中樹葉表示所收到的評價的hash值,而葉子的 index 表示 attester ID,UST 樹葉的定義為
USTLeaf = hash(posRep, negRep, graffiti)
例如 Airbnb 的 ID 是1,Booking.com 的 ID 是 3,那 Alice 的 User State Tree 中 index 為 1 的地方會有自己在 Airbnb 獲得的總評價的 hash 值,而 index 為三的地方則為空的評價。另一個使用者 Bob 的 User State Tree 亦同,在 index 為 1 的地方會有自己在 Airbnb 獲得的評價,在 index 為 3 的地方會有自己在 Booking.com的評價。
Global State Tree (GST)
是一固定樹高的 Incremental merkle tree
Global State Tree 的葉子到樹根都是公開的資訊,當有使用者註冊或者更新 User State Tree 時會在 Global State Tree 裡新增一個新的樹葉,GST 樹葉的定義為:
GSTLeaf = hash(id, USTRoot)
先送出的樹葉先插入到較前面的 index,之後的樹葉依序插入 GST 中。
以 Alice的例子來說,當 Alice跟 Bob註冊 Unirep時,都會產生一個 GST的樹葉,更新 GST的樹根,若 Alice先註冊,則 Alice的 index會較 Bob前面。注意,這邊的 Airbnb 和 Booking.com 等 attester 並不是用這棵 Global State Tree註冊。
Epoch Tree
是一個 Sparse merkle tree
Epoch Tree 跟 Global State Tree 一樣從葉子到樹根都是公開的資訊,Epoch Tree 中樹葉的 index 為 epoch key,而樹葉的值為該 epoch key 的 sealed hash chain
每個 epoch key 都有一個 hash chain,hash chain 的定義為
hashedReputation = hash(attestIdx, attesterID, posRep, negRep, graffiti)hashChain[epochKey] = hash(hashedReputation, hashChain[epochKey])
此 hash chain 是為了防止使用者漏收了哪一筆評價,如果使用者少收了其中一筆評價,則 hash chain 的結果會完全不同。最後驗證時如果其中一個 epoch key 的 hash chain 改變,會造成 epoch tree 樹根跟原本的 epoch tree 的樹根不同。
而 Sealed hash chain 是在每個 epoch 結束後,Unirep 智能合約會再將這條 hash chain 再 hash 一次
sealedHashChain[epochKey] = hash(1, hashChain[epochKey]) isEpochKeyHashChainSealed[epochKey] = true
需要再把這條 hash chain 封起來的用意是,避免這把 epoch key 過了這個 epoch 之後再繼續接收評價,所以 epoch tree 會用這個 epoch key 最後的 sealed hash chain 去計算樹根。
Nullifier
中文翻譯為註銷符,當我們要防止一件事情重複發生時,就可以使用這個 Nullifier
Unirep 中使用到 Epoch key nullifier:此 nullifier 是用來限制使用者不能在不同的 epoch 使用重複的 epoch key 去收取評價,也不能被其他使用者使用;此外也可以用來檢視使用者是否重複執行 UST 的更新
Nullifier 也用 hash 計算,但多使用一個 domain 變數,避免與 epoch key 產生相同的 nullifier 而洩露自己擁有的 epoch key,也可以用不同的 domain 產生不同用途的 nullifier
epochKeyNullifier = hash(EPOCH_KEY_DOMAIN, id, epoch, nonce)
Epoch Transition
一個 epoch 結束過後,要透過 epoch transition 的步驟,更新 Unirep 及使用者的狀態
其中要做的事包含將智能合約上的 epoch 數加一,還有將所有 epoch key 的 hash chain 封起來
接著使用者就可以執行 User State Transition 更新自己的 UST
User State Transition
到下一個 epoch 後,使用者可以透過自己的 identity,找出自己在前一個 epoch 所有的 epoch key,並根據每把 epoch key 收到的評價更新到自己的 UST,最後計算出最新的評價狀態,產生一個 GST的樹葉,插入 GST 中 (如同註冊時一樣)。
使用者之後如果要花費評價或者產生下一個 epoch 的 epoch key 時,因為必須確認自己的 UST 在當前的 epoch,所以需要經過 User State Transition 確保自己有一個 GST 的樹葉在 GST 中。
Unirep 協定
有了 Unirep 的名詞定義後,接著介紹 Unirep 是如何運作的。
註冊
Unirep 的 user 和 attester 的註冊方式不同:
User signup and attester signup in Unirep
User
User 透過 semaphore 產生 identity 和 identity commitment,identity 就如同私鑰,identity commitment 就如同公鑰
將 identity commitment 和預設的 UST 樹根經由 hash 計算得 GST 的一個樹葉
若使用者要證明自己在某個 epoch 有註冊或者有更新自己的 UST,則證明自己是 GST 的某一個樹葉,利用零知識證明的方法,輸入 identity、UST 樹根,還有 merkle tree 中要計算 hash 值的相鄰節點,則最後可得到一個 GST 的 root,其他人可以驗證這個 GST 的 root 是否符合這顆公開的 GST。
Attester
Attester 則是用自己的錢包,或者用智能合約的地址註冊,呼叫 attester sign up 的 function 後,Unirep 會指定一個 attester ID 給這個地址,往後 attester 用相同錢包或合約地址給予評價時,Unirep 會檢查此地址是否被註冊,若有註冊則可以給予 epoch key 評價。
以 Alice 和 Bob 為例,Alice、Bob、Airbnb的房東、Booking.com的房東會產生 identity 並且透過 Unirep 合約用 user 的註冊方式獲得一個 GST 的樹葉代表自己;
而 Airbnb 和 Booking.com 會透過 attester 的註冊方式,使用特定的錢包地址或是撰寫智能合約呼叫 Unirep 的 attester sign up function。
當然 Alice 或 Bob 如果想用自己的錢包註冊為 attester 也是可以,這時合約就會紀錄 Alice 和 Bob 的錢包地址,並給予一個新的 attester ID。
給予評價
在 Unirep 中評價的接收者是 epoch key,接著介紹 user 和 attester 是如何互動。
How an attester gives reputation to an epoch key
Alice 在 Unirep 註冊過後,就可以產生 epoch key 接收評價
epochKey = hash(identity, epoch, nonce)
但 Airbnb 的房東看到這把 epoch key,要如何知道 Alice 確實是 Unirep 的合法使用者,且 epoch key 的 是合法的,例如 nonce 小於 5,或者 epoch 是當前的 epoch?
如果 Alice 直接提供 epoch 和 nonce,別人沒有 identity 也無法計算此 epoch key,更不用說如果 Alice 提供 identity 會造成 Alice 完全沒有隱私可言,所有人都可以計算出 Alice 收過哪些評價。
因此我們用一個零知識證明,證明此 epoch key 是合法的。細節請參考 epoch key proof,主要是證明使用者有一個合法的 GST 樹葉在 GST 中,並且 epoch 和 nonce 也都符合。
房東得到 Alice 提供的 epoch key 和 epoch key 的證明,並且透過 Unirep 的合約驗證通過之後,就可以給予評價。
獲得空投評價、使用者可以給予評價的限制可以由各個應用自行定義,例如 Airbnb 可以決定空投 30 個正評給使用者, Booking.com 可以決定空投 20 個正評給使用者。
另外,為了確認房東也是合法的使用者,也為了防止房東重複花費 (double spending) 自己的評價點數,Unirep 上的應用也可以用 reputation nullifier 及其 proof 去證明使用者合法使用自己的評價。
例如,此 reputation nullifier 可以用下列計算方式取得:
reputationNullifier = hash(REPUTATION_DOMAIN, id, epoch, nonce)
當 reputation nullifier 及 proof 產生後,就會與房東要給的評價一起發送到 Airbnb 的智能合約上,智能合約會驗證 proof 是否合法,nullifier 是否有被發送過,若檢查都通過的話則 Unirep 會紀錄此評價給 epoch key,並將 hash chain 更新。
接收評價
使用者即使可以證明自己擁有哪一把 epoch key 並且大家都知道這把 epoch key 有多少評價,但這有可能造成使用者故意忽略其他把 epoch key 中對自己不好的評價,因此 Unirep 限制使用者只能在每個 epoch 結束,每把 epoch key 都封起來之後,才能用 User State Transition 更新自己的評價。
User State Transition in Unirep
這裏也是用 User State Transition Proof 去保證使用者是根據正確的方式計算出最新的 UST,且用 epoch tree 限制使用者必須處理每一把 epoch key 的結果。
亦即,需要等到 epoch 結束後,Alice 才能透過 User State Transition 獲得 Airbnb 房東的評價,更新自己的使用者狀態。
證明評價
當使用者通過 User State Transition 之後會有最新的 UST 狀態,此時 Alice 就可以透過 reputation proof 向 Booking.com 她有來自 Airbnb 的評價,在reputation proof 中檢查使用者是否有其宣稱的 UST (例如總共有多少好評、多少差評來自哪一個 attester ID),並且此 UST 的狀態儲存在當前 epoch 的 GST 中。
在生成 reputation proof 時,即使 Alice 總共有 100 個好評,但 Alice 仍可以產生「至少有10個好評」的證明,Booking.com 的房東若驗證成功,則只能知道 Alice 宣稱的「至少有 10 個好評」而不能知道 Alice 總共有 100 個好評。
常見問題
Alice 能不能給 Airbnb 的房東評價? Alice 能不能給 Bob 評價?
可以。
Airbnb 的房東和 Bob 也都能產生 epoch key,因此如果 Alice 有兩者的 epoch key 及合法的 proof 則可以給予評價。此時 Alice 可以選擇透過 Airbnb、Booking.com、或甚至自己的 Ethereum account 當作證人給予評價 (也必須選擇一個證人)。
Alice 可以透過 Unirep 給 Airbnb 評價嗎?
如果 Airbnb 也透過 Unirep 註冊為使用者,並且產生 epoch key 的話就可以。但如果 Airbnb 只註冊為證人的話不行。
Alice 可以證明評價來自哪一個 Airbnb 房東嗎?
如果 Airbnb 的房東沒有註冊為證人,則 Alice 不能證明評價來自哪個房東。
若 Airbnb 的房東用自己的 Ethereum account 註冊為證人,則 Alice 只能證明評價來自這個 Ethereum account,但無法知道這個 account 是一個 Airbnb 的房東。
從 Airbnb 獲得的評價可以在 Booking.com 花費嗎?
需看 Booking.com 的智能合約如何定義,但一般來說不行,因為 attester ID不同,但未來可能會開發各個應用程式之間的兌換評價功能。
如果遲遲不執行 User State Transition 會發生什麼事?會不會收不到之前的評價?
若 Alice 在第一個 epoch 註冊,並在第一個 epoch 產生 epoch key 接收評價,但 Alice 到第五個 epoch 才執行 User State Transition,那 Alice 會根據第一個 epoch 的 GST、epoch tree 執行 User State Transition,因此仍然可以在第五個 epoch 收到來自第一個 epoch 的評價;而在第二到第四個 epoch 因為 Alice 無法產生出合法的 epoch key proof,因此無法接收評價。
User State Transition 可以自動執行嗎?
不行。
只有使用者主動給出私鑰,即 semaphore 的 identity,才可以產生合法的 User State Transition proof,若將私鑰交給第三方幫忙執行可能會侵害使用者的隱私。
結論
Unirep 是一個具有隱私保障的評價系統,透過 ZKP 的保護使用者可以在匿名的情況下收取評價、給予評價、並且向他人證明自己的評價。Unirep 可以用於跨應用程式間的評價證明,可以在 A 應用程式中獲得評價,並向 B 應用程式證明在 A 應用程式中獲得多少評價。若想了解更多有關 Unirep ,可以參考 Github、文件或加入 telegram 群組討論。
本文感謝 CC, Nic, Kevin, Doris 協助審稿。
Unirep介紹: 使用ZKP的評價系統 was originally published in Taipei Ethereum Meetup on Medium, where people are continuing the conversation by highlighting and responding to this story.
👏 歡迎轉載分享鼓掌
同時也有1部Youtube影片,追蹤數超過11萬的網紅GreatKidsLearning,也在其Youtube影片中提到,二次函數的最大值與最小值 (The maximum or minimum value of a quadratic function.)...
二次函數最大值 在 大詩人的寂寞投資筆記 Facebook 的精選貼文
「利潤」究竟是什麼
這一講不是要講經商,我們小小地梳理一個大大的話題:從經濟學角度看,人生應該追求什麼。
簡單地說,最值得追求的東西是「利潤」。
我不信你會不想要利潤。利潤是收入減去成本剩下的那一部分,是收穫比付出多出來的部分。利潤是正的,說明你的一切努力都沒有白費,說明瞭社會對你的肯定。利潤要是負的,就說明你創造的價值配不上你的一番折騰。
但你要是細想,利潤是一個神秘的東西。
*
你必須直接去市場上買賣點什麼東西才談得上利潤。上班拿固定工資是沒有利潤的。哪怕你工資再高,那也只是你的勞動所得,都是根據你這個水平,你應該得的,是市場認為正好等於你的付出的回報 —— 這表現在你要是不上班就沒有收入。
而利潤則是「不該得」的東西,可以說是躺著賺的錢。這個性質曾經使得有些思想家認為拿利潤是不道德的。
馬克思譴責利潤。你開個工廠,買了機器和廠房,雇了工人,進了一批原材料,工人生產出產品,你把產品賣掉。然後你一算賬,賣產品的收入減去工人工資、機器廠房和原材料的花費,還多出來了一筆錢,這就是利潤。你欣然把這筆錢放入自己口袋。馬克思說且慢!工人累死累活工作才拿那麼一點工資,你幹什麼了就拿這麼多錢,你那叫剩餘價值!你無償佔有了別人創造的價值。
你當然不服氣。你說不是啊,我管理工人,我組織生產,我聯繫了進貨和銷售,我安排廠裡的大事小情,這怎麼不是創造價值呢?
馬克思會告訴你,你做的這些事兒的確也是勞動,你可以拿一份高工資,但你的工資不會像利潤那麼高。你完全可以雇一個職業經理人替你管理工廠。你把職業經理人的工資發了,還會剩下一筆錢,這筆錢才是真正的利潤。
這個計算讓馬克思深感憤怒,產生了深遠的影響……咱們還是單說資本主義這邊對此是怎麼想的。崇尚市場的經濟學家也算了這個賬,但結果是利潤好像不應該存在。
我們假設老張開工廠賺了一萬塊錢的「淨」利潤。這個是把老張本人付出的管理勞動該拿的那部分報酬去掉之後剩下的錢,是老張「躺賺」的錢。那如果是這樣的話,市場上就應該出來一個老李:老李說既然是躺賺,我不用那麼高的利潤,我躺賺五千元就行,我願意把商品賣便宜點,給工人工資高點。那你說老張能幹過老李嗎?
你很容易想到老張繼續存在的理由。比如老張有資本而老李沒有。或者老張跟政府關係好,壟斷了這塊業務。或者老張掌握一個技術護城河,老李學不會。但是對經濟學家來說這些都不是本質問題:資本可以貸款,跟政府的關係可以用一個更好的條件重新談,技術可以請人研發。事實上,經濟學家的推理是,哪怕現在還沒有一個具體的老李,只要市場存在老李出現的可能性,老張就不敢壓榨太高的利潤,他必須用比較低的價格和比較高的工資預防老李的出現。
要這麼算的話,市場充分競爭的結果一定會把利潤變成 0。總會有一個老王出來,說我就當自己是個職業經理人跟大家交朋友算了,我拿個應得的工資就行,利潤我不要。
那真實世界里的利潤是從哪來的呢?當然市場不可能是充分競爭的,總會有些老張偶爾能享受到利潤……但市場力量應該讓利潤越來越薄才對。經濟學家必須找到一個產生利潤的過硬的機制,否則解釋不了為什麼總有人拿那麼高的利潤……甚至解釋不了為什麼有人願意開公司。
*
利潤從哪裡來這個問題的解決,在經濟學史上是一個里程碑。1921年,美國經濟學家弗蘭克·奈特(Frank Knight, 1885-1972)出版了《風險、不確定性與利潤》(Risk, Uncertainty, and Profit)一書 [1],提出了一個傳世的洞見:利潤來自不確定性。
組織生產、採購和營銷、日常的管理,企業中一切常規的操作都可以由拿固定工資的人做,只有一件事必須由企業家本人做,那就是風險決策。
比如說,為了在今年秋季上市一批新女裝,我們必須在夏天就定下來款式,備工備料,展開生產。可是秋天還沒到,現在誰也不知道到時候流行哪個款式,那我們生產什麼呢?這個決策,必須由企業家本人做出。為什麼?因為他是承擔決策風險的人。
如果你賭對了,秋季正好流行這款女裝,因為別的服裝廠沒生產只有你生產出來了,你就佔據了稀缺,你就可以要一個高價,利潤歸你。你要是賭錯了,到時候服裝賣不出去,工人和經理們還是會拿同樣的工資,損失也歸你。
生產、日常管理、冒險,是三種不同的能力。為什麼企業家要開公司?因為他敢冒險。為什麼工人和經理人選擇拿固定工資?因為他們不想冒險。
這個道理聽著挺簡單,但是其中有個大學問。奈特之前的經濟學家也想到了企業家承擔風險,但是他們沒搞清楚到底什麼是風險。
*
如果女裝只有比如粉色和綠色兩個選擇,而且你明確知道它們流行的可能性都是 50% —— 那這個風險其實不用企業家承擔。因為你可以買保險!概率已知的風險都是可以管理的。銀行可以給生產兩款女裝的工廠都提供貸款,到時候肯定一個賠錢一個賺錢,只要利息和保險合適,銀行和企業雙贏。有這個保險機制在,大家誰都不用冒險,可以各自拿一份固定工資,根本不需要企業家。
奈特的真正貢獻在於,他把風險給分成了兩種。
第一種就叫「風險(risk)」,但是特指那些已知概率大小的風險。這種可以用保險解決,不需要企業家。
第二種叫「不確定性(uncertainty)」,是指那些無法評估概率大小,可能是從來沒出現過的新事物,甚至是現在人們根本無法想象的東西。這個不確定性,才是企業家存在的理由,才是利潤的來源。
現代經濟學家把這個不確定性特別稱為「奈特不確定性(Knightian uncertainty)」。我們專欄講過 [2],統計學家有個更科學的說法。已知概率大小的,叫做「偶然不確定性(Aleatoric uncertainty)」, 也叫統計不確定性。不知道概率大小的,叫做「認知不確定性(Epistemic uncertainty)」,也叫系統不確定性。前者發生的事情都是你事先能想到的,後者則是你想不到的。比如「黑天鵝」事件,就是一種認知不確定性。
你開一個賭場。賭場每天都在跟賭徒們賭博,但是因為輸贏的概率是固定的而且有利於你,所以你的日常經營本身並不是冒險。真正的冒險是要不要開這個賭場:你能預測客流量足夠讓你收回投資嗎?你能擺平當地黑社會嗎?你能確保政府發展博彩業的政策不會變嗎?這些事兒沒法計算概率。
搞定這些不確定性,才是企業家該乾的事兒,也是企業家的回報所在。
流行趨勢通常不能用以往的經驗判斷。有個企業家認准了一個全新的款式,說我非得生產這個,銀行能給他擔保嗎?這個不確定性沒法系統化管理,他自己必須承擔 —— 這才是企業家存在的意義。你要是願意給這樣的項目投資、分擔不確定性 —— 而不是把錢交給銀行拿固定的利息 —— 你也是企業家。
要做服裝這一行的企業家,你肯定得對流行趨勢有個很好的感覺才行。不過企業家本人不一定非得特別懂女裝 —— 他完全可以請人來給他設計,只是設計師不承擔不確定性,人家拿固定的設計費,風險還是要由企業家承擔。
簡單說,企業家,是市場上的 player。他拒絕聽別人的安排,非得按照自己的想法決定做什麼,然後他安排別人也按照這個想法去做,最後他獨自承擔後果。
*
奈特找到了公司存在的最根本理由。市場競爭再充分也不可能是絕對可預測的,未來總會有各種各樣的不確定性,需要企業家在各個方向上大膽探索。奈特後來成為經濟學的大宗師,他本人沒得過諾貝爾獎但是他有五個弟子得了諾貝爾經濟學獎,他是「芝加哥學派」的祖師爺。
奈特之後,別的經濟學家又找到了公司存在的其他理由。比如科斯說公司減少了交易成本能起到協調作用。張五常說公司提供了合約。還有人說公司解決了監督、提供了資源獨特性……等等等 [3],但是奈特這個「不確定性」的說法,是最根本的。
如果從某一天開始,世界上再也沒有不確定性了,那麼市場的力量就會迅速把公司利潤變成 0:企業家就不需要存在,大家都應該拿固定工資。
其實現在企業家的日子也不好過。我們看街上那些餐館,開了關關了開,真正能長期賺錢的沒有幾家,可能大部分老闆都是賠錢。沒有稀缺是不可能賺到錢的,但是利潤只發生在你剛剛掌握某種稀缺、而別人還沒有跟上的那個時間段。別人跟上了,模仿了,你就必須再去尋找新的不確定性。
一切賺錢的生意都有不確定性。你把一大筆錢放銀行裡拿利息,那叫躺著花錢不叫躺著賺錢。哪怕是買幾套房子收租金,你都得面對房產市場的不確定性。
世界上沒有一勞永逸的利潤,也沒有真正躺著賺錢的企業家。
那你說平均而言,企業家的收益是正的還是負的呢?我到底該不該去做個企業家呢?沒有答案。有答案就不叫不確定性了。
*
不確定性都是從哪來的呢?一個有意思的不確定性是中國經濟學家張維迎在 2008 年的一次演講中說的 [4]。他說中國改革開放這麼多年之中,商業活動最大的不確定性,是「體制的不確定性,政策的不確定性,政府行為的不確定性。」這體現在政府對資源的調配非常隨意。
張維迎當時說,正是這個不確定性加劇了中國的貧富差距。在中國市場化程度高,體制不確定性低的地區,比如浙江省,人們更富裕,收入差距反而更低:因為利潤分布更均勻。
這個規律是不確定性越大,利潤就越高 —— 企業家為利潤而奮鬥,但是市場看不見的手恰恰在降低總利潤。是那些看得見的手,提供了額外的不確定性,才給人帶來不合理的利潤。
那你說如果我們把體制給理順,讓競爭越來越公平,未來的不確定性會不會越來越少呢?不一定。
*
奈特列舉了不確定性的好幾種來源,比如未來人口的變化、資源的供給等等。其中我們現代人最關注的肯定是創新。創新本質上是不可預測的,你不知道未來會有什麼新技術出來,你也不知道一個新技術出來會不會被市場接受。一切創新都有強烈的冒險成分,關於這一點已經有太多經濟學家討論了。
而奈特更厲害的一個洞見,則是「價值」的不確定性。說白了就是人的慾望的不確定性,你不知道未來的人喜歡什麼。奈特 1924 年發表了一篇文章叫《經濟學中科學方法的局限性》,說經濟學不僅僅是什麼資源的有效調配,把一個什麼價值函數最大化的問題,因為人的價值觀是會變的 ——
「人生在根本上是對價值的探索,是努力發現新價值,而不是照著現有的價值觀把生產和享受最大化。」[5]
一百多年前整天坐馬車的人沒有想要一輛汽車。2006 年以前的人並不期待智能手機。今天的多數人不能理解馬斯克為什麼非得讓人去火星。人生的終極任務不是滿足某種價值,而是發現和創造新價值。
因為這個見識,奈特後來被認為是個道德哲學家,而不僅僅是個經濟學家。
也因為這一點,你不需要非得是個企業家,也不一定非得拿金錢利潤。藝術家、教育家、每個工人和管理者、包括每個消費者,都可以是價值的發現者和不確定性的製造者。
只要把周圍的世界往你想的那個方向上推動一小步,就算是你的成功。
注釋
[1] 弗蘭克·奈特,《風險、不確定性和利潤》,中文有郭武軍、劉亮翻譯版,華夏出版社 2013。
[2] 精英日課第三季,哪種不確定性?什麼黑天鵝?
[3] 關於公司為什麼存在的理論發展總結,可參考向松祚,《新經濟學》第二卷,新經濟範式。
[4] 張維迎的這次演講首次發表於《經濟觀察報》2008年1月20日,修改後的文章曾收入作者主編的《中國改革30年:10位經濟學家的思考》。
[5] Frank Knight (1924), "The limitations of scientific method in economics」, 原文是「Now this, we shall contend, is not very far; the scientific view of life is a limited and partial view; life is at bottom an exploration in the field of values, an attempt to discover values, rather than on the basis of knowledge of them to produce and enjoy them to the greatest possible extent. We strive to "know ourselves," to find out our real wants, more than to get what we want. This fact sets a first and most sweeping limitation to the conception of economics as a science.」
二次函數最大值 在 台灣物聯網實驗室 IOT Labs Facebook 的最讚貼文
為了讓 AI 不斷打怪升級,DeepMind 打造「宇宙」
作者 雷鋒網 | 發布日期 2021 年 07 月 30 日 8:15 |
DeepMind 又給我們小驚喜。我們都知道,強化學習苦於類化能力差,經常只能針對單個任務從頭學習。
DeepMind之前開發的AlphaZero,儘管可以玩圍棋、西洋棋和日本將棋,但每種棋牌遊戲都只能從頭訓練。類化能力差也是AI一直被詬病為人工智障的一大原因。人類智慧的厲害之處,就在藉鑑之前經驗迅速適應新環境。
但類化能力不是一蹴而就,就像玩遊戲,也是先做簡單任務,逐步升級到複雜任務。《空洞騎士》(Hollow Knight)一開始只需要隨意走動揮刀砍怪,但噩夢級難度的「苦痛之路」關,沒有前面累積的技巧,只能玩寂寞。
多任務宇宙
DeepMind此次採用「課程學習」,讓智慧體於不斷擴展升級的開放世界學習。也就是說,AI新任務(訓練資料)是基於舊任務不斷生成。智慧體可盡情鍛鍊自己,簡單的如「靠近紫色立方體」,複雜點的如「靠近紫色立方體或將黃色球體放在紅色地板」,甚至和其他智慧體玩耍,如捉迷藏──「找到對方,且不要被對方發現」。
每個小遊戲存在世界小角落,千千萬萬個小角落拼成龐大的物理模擬世界,如下圖的幾何「地球」。總體來說這個世界的任務由三個要素構成,即任務=遊戲+世界+玩家,並根據三要素關係,決定任務的複雜度。
複雜度的判斷有四個維度:競爭性、平衡性、可選項、探索難度。
比如「搶方塊」遊戲,藍色智慧體需要把黃色方塊放到白色區域,紅色智慧體需要把黃色方塊放到藍色區域。這兩個目標矛盾,因此競爭性較強;同時雙方條件對等,平衡性比較高;因目標簡單,所以可選項少;DeepMind把探索難度評為中上,可能是因定位區域算較複雜的場景。
再如「球球喜歡和方塊一起玩」遊戲,藍色和紅色智慧體有共同目標,讓相同顏色的球體和方塊放在相近位置。
這時競爭性自然很低,平衡性毋庸置疑很高的;可選項比上面遊戲高很多;探索難度沒有定位區域,智慧體隨便把球體和方塊放哪都行,難度就變小了。
基於這四個維度,DeepMind打造超大規模「宇宙」任務空間,幾何「地球」也只是這宇宙的小角落,是四維任務空間的一點。DeepMind將「宇宙」命名為XLand,包含數十億個任務。
來看XLand的全貌,由一系列遊戲組成,每個遊戲在許多模擬世界進行,這些世界的拓樸和特徵平滑變化。
終生學習
數據有了,接下來得找到合適的算法。 DeepMind發現,目標注意代理(GOAT)可學習更通用的策略。
具體來說,智慧體輸入包括第一視角的RGB圖像、本體感覺以及目標。經過初步處理後,生成中間輸出,傳遞給GOAT模組,會根據智慧體目前目標處理中間輸出的特定部分,邏輯分析目標。
邏輯分析是指,每個遊戲可藉由一些方法,構建另一個遊戲,並限制策略的價值函數的最優值上限或下限。
DeepMind提出一個問題:對每個智慧體,什麼樣的任務是最好的?換句話說,打怪升級時,什麼樣的關卡設置才讓玩家順利升級為「真」高手,而不是一刀9999?
DeepMind的答案是,每個新任務都基於舊任務生成,「不會太難,也不會太容易」。其實恰好是讓人類學習時感覺「爽」的興奮點。
訓練開始時,太難或太容易的任務可能會鼓勵早期學習,但會導致訓練後期的學習飽和或停滯。不要求智慧體某任務非常優秀,而是鼓勵終身學習,即不斷適應新任務。所謂太難、太容易是較模糊的描述。需要量化方法,在新任務和舊任務之間彈性連接。
怎麼不讓智慧體做新任務時不適應而「暴死」?進化學習就提供很好的靈活性。總體來說,新任務和舊任務同時進行,且每個任務有多智慧體參與「競爭」。舊任務適應好的智慧體,會選拔到新任務繼續學習。
新任務中,舊任務的優秀智慧體權重、瞬間任務分佈、超參數都會複製,參與新一輪「競爭」。除了舊任務的優秀智慧體,還有很多新人參與,這就引進隨機性、創新性、靈活性,不用擔心「暴死」問題。
當然,因任務不斷生成、動態變化,一個任務可訓練不同長處的智慧體,並往不同方向演化(隨著智慧體相對性能和強健性進行)。最終每個智慧體都會形成擅長任務的集合,就像春秋戰國時期「百家爭鳴」。說打怪升級顯得格局小,簡直是模擬地球。
DeepMind表示,「這種組合學習系統的特性是,不最佳化有界性能指標,而是更新定義的通用能力範圍,這使智慧體開放式學習,僅受環境空間和智慧體的神經網路表達能力的限制。」
智慧初現
最終這複雜「宇宙」升級、進化、分流的智慧體長成了什麼優秀物種?DeepMind說,智慧體有很明顯的零樣本學習能力,比如使用工具、合圍、數數、合作+競爭等。
來看具體例子。首先智慧體學會臨機應變。目標有三個:
黑色金字塔放到黃色球體旁邊
紫色球體放到黃色金字塔旁邊
黑色金字塔放到橙色地板
AI一開始找到一個黑色金字塔,想拿到橙色地板(目標3),但搬運過程瞄見黃色球體,瞬間改變主意,「我可以實現目標1啦」,將黑色金字塔放到黃色球體旁邊。
第二個例子是,不會跳高,怎麼拿到高台上的紫色金字塔?智慧體需要想辦法突破障礙,取得高台上的紫色金字塔,高台周邊並沒有類似階梯、斜坡的路。
因不會跳高,所以智慧體「掀桌子」,把周邊幾塊豎起來的板子弄倒。然後一塊黑色石板剛好倒在高台邊,「等等,這不就是我要的階梯嗎?」這過程是否體現了慧體的智慧,還無法肯定,可能只是一時幸運。關鍵還是,要看統計數據。
經過5代訓練,智慧體在XLand的4千個獨立世界玩了約70萬個獨立遊戲,涉及340萬個獨立任務,最後一代每個智慧體都經歷2千億次訓練步驟。智慧體已能順利參與幾乎每個評估任務,除了少數即使人類也無法完成的任務。
DeepMind的研究,或許一定程度體現「密集學習」重要性。也就是說,不僅資料量要大,任務量也要大。這也使得智慧體在類化能力有很好表現,如資料顯示,只需對一些新複雜任務進行30分鐘集中訓練,智慧體就可快速適應,而從頭開始用強化學習訓練的智慧體根本無法學習這些任務。
往後我們也期待這「宇宙」更複雜和生機勃勃,AI經過不斷演化,不斷給我們帶來驚喜(細思極恐)的體驗。
資料來源:https://technews.tw/2021/07/30/deepmind_xland/
二次函數最大值 在 GreatKidsLearning Youtube 的最佳解答
二次函數的最大值與最小值 (The maximum or minimum value of a quadratic function.)
二次函數最大值 在 二次函數.doc 的推薦與評價
從變速運動到極值問題都會用到。 二次函數的圖形不是直線,而是拋物線,以下是兩個例子:. 要掌握二次函數,需要瞭解基本的函數作圖,還有一元二次方程式。 ... <看更多>
二次函數最大值 在 Re: [中學] 二元二次函數求極值- 看板Math - 批踢踢實業坊 的推薦與評價
※ 引述《yosifu ()》之銘言:
: 如題,求2*x^2+y^2+(2*x-y+3)^2 的最小值。
: 我把它全部乘開然後整理,不過好像觀察不出什麼結論,
: 想請問是否有其他的方法可以判斷?
: 感謝!
如果對數字的直覺很好,可以用科西不等式
但既然你已經乖乖展開了,那不妨就老老實實地配方吧
一元二次函數
Au^2 + 2Bu + C
= A(u+B/A)^2 + C - B^2/A
當 u = -B/A 時
會有最小值 C - B^2/A
其實,二元二次函數也是一樣的
原式展開 = 6x^2 + (-4)xy + 2y^2 + 12x + (-6)y + 9
你可以把x和y看成一組矩陣
令 u = [ x y ]' (':代表轉置矩陣)
A = [ 6 -2 ] (讓A成為對稱矩陣)
[ -2 2 ]
B = [ 6 -3 ]'
C = [ 9 ]
原式 = u'Au + 2B'u + C
= ( u + A^(-1)B )'A( u + A^(-1)B ) + C - B'A^(-1)B
當 u = -A^(-1)B 時
會有最小值 C - B'A^(-1)B
仔細瞧瞧
這和前面提到的一元二次配方法,一模一樣!!
--
舉一反三
你應該想想以下三個問題
(1) 三元以上也可以用一樣的方法嗎?
(2) 為什麼要強調A是對稱矩陣?
(3) 有最小值的條件是什麼?
有最大值的條件又是什麼?
有沒有可能既沒有最小值也沒有最大值?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 36.228.118.133
... <看更多>