S10-深網智慧與腦資訊學

[S10_Brain] post #1 - 498515102

海馬迴(Hippocampus

  • aaronwang's blog
  • 1 篇新回應
  • 閱讀全文
  • Share/Save
  • 0
  • Post #1~全球腦(Global brain)& youtube brain相關短片(轉貼)~496515249

    全球腦是指一個關於分享人類知識,所有人類智力的思想、創新和發明的總和的概念。

    目錄
    1
    概念的歷史 
    2
    全球腦的歷史 

    [S10_Brain] 深網腦資訊共筆與Lab分組

    請同學將本學期的課程分組名單回覆於本篇下方
    以 2 人為一組自由搭配, 每組於下列 A / B 兩類都各需選一項作為共筆主題
    共筆主題以搶標方式決定, 先選者得標.

    蕾貝嘉薩克斯:大腦如何做道德判斷(以及TMS的簡介)

    從網路上發現了此段影片,雖然講授的部份非目前課堂所學到的

    但是,是一個非常有趣的一段實驗以及研究

    此為影片的網址   http://ppt.cc/p0jP

    演講者Rebecca Saxe   是MIT腦與認知科學的助理教授

     

    此段影片主要針對RTPJ作實驗  也就是right temporal parietal junction(右顳顱頂接縫區)

    【轉錄】愈會放鬆,注意力愈能集中

    轉錄地點:telnet://ptt2.cc (批踢踢兔) 看板:ZZZZZZZZZ9 (Z9) 

    文章代碼(AID): #1BYef_Tn (ZZZZZZZZZZZ9) [ptt2.cc] 

    標題: [轉錄][Life] 愈會放鬆,注意力愈能集中

     

    本文原作者: nanami45 (優雅致富) 看板: OfficeLady

    (但是由於在ptt 及 ptt2 都找不到 OfficeLady 板 所以只能標示出 Z9 板的出處)

    ------------------------------------------------------------------------

    正文開始:

    愈會放鬆,注意力愈能集中-大腦活性力

    要怎樣才能集中注意力,全心在工作上衝刺?其實愈會放鬆,注意力愈能集中;愈懂得不「用腦過多」、「腦筋疲勞」的人,愈能有效率地把事情做好。只要學會工作時間分配法,就能隨時保持大腦的活性度,讓你在不同的工作時間,都能發揮最大戰力。

    【轉錄】很過分的 Amazon iPhone App 之 Remembers

    【轉錄】哈佛大學教授:美國學生畢業前必做20件事

    來源:
    http://big5.ifeng.com/gate/big5/edu.ifeng.com/abroad/201002/0205_6979_1538575.shtml

     

    大學生入學季節,《波士頓環球報》刊登一篇文章,題目叫“為了找到好工作現在要做的20件事”。

    Lab T2 : Exercise.4-6

    組別:第二組  

    組員:許復凱 劉凱銘 許聆容

    先說這題在做什麼:題目說,現在我們的code可以依照inbound links中的text做rank了。
    可是有一種狀況是這樣的,就是我們有時候用關鍵字去搜尋,但是最符合的網站可能沒有你的關鍵字內容
    這時候就會發生搜尋不到的情形,題目提到搜尋圖片就是典型的例子。
    課本希望我們改善他的search code解決這個問題。

    早在前幾次課堂中報告了這題,當時的作法是利用資料庫去另建table做處理,想得很複雜
    之所以會想要從資料庫著手,最主要原因是當時沒有時間跑一次crawler把data建起來

    現在重新著手這題,卻意外發現這題只要加個關鍵一行code就可以完成
    道理很簡單,我在記錄這頁有什麼關鍵字的時候,偷偷把這些關鍵字也link給下一個page
    找到這個function : addlinkref(self,urlFrom,urlTo,linkText)
    最後 + self.con.execute("insert into linkwords(linkid,wordid) values (%d,%d)" % (toid,wordid))
    OK!
    (單純但是這樣做像是wordlocation那個資料表就會不完善了,不過是小問題~重點是可以搜到)

    我在課堂報告也提出了一個機制,道理跟我現在弄得很像
    不過我每個關鍵字都給他加上了權重,利用上方程式碼加上去的關鍵字權重都給0.3,一般關鍵字就是原來的1
    這樣做不會影響到原本的演算法,在計算上只要在最後面加上取floor,也就是最後計算1.2則以1算,2.1以2算
    物理上的意義就是,一個page接受的外部相同關鍵字大於4個才可以跟出現在那個page的關鍵字權重相當(4*0.3=1.2)
    當然數值只是一個大概,沒有實際測量過,方法我倒覺得挺不錯
    可是當我發現這個方法要加在程式裡面就好麻煩唷>"<

    Term Project Report

    系級:資工碩職一   學號:497515222   姓名:謝佳成

    主題:利用GPS與軌跡紀錄器在Google Maps記錄自己的私房玩樂地圖

    動機:

    不知是不是因為左撇子的關係(愛牽拖),從小就左右不分,白天夜晚對道路的感受也不同

    (明明同一條,怎就像不同的路)十足的大路痴一個,而GPS 的發明,不單單是救了漸漸萎靡

    不振的PDA 市場,更是從小受限方向感不好苦的路痴一族最大福音,而隨著WEB 2.0的模式下

    ,GPS與WEB2.0 也碰出了新的火花。各家GPS的景點千篇一律,在這樣樣追求個性化的時

    代,記錄與分享自己的私房玩樂地圖更有創意。

    方法:利用Google Maps,以及它所提供的API來做出可以提供提供了許多愛旅行或是有特

           定需求的使用者有了凡走過必留下痕跡的紀錄。

     ===========================================================================

     圖一、早期的GPS 的吳現畫面

    缺點:

    一、誤差值為 3 ~ 5公尺。

    二、畫面缺泛真實感,在台北眾多封閉形的高架道路中,對於不熟悉或第一次行駛的高架道路,會造成誤上或誤下交流道的困優。

     

    =======================================================

    圖二 

    已大力改善畫面缺泛真實感的缺點。

    ============================================

    圖三、本次搭配的路徑記錄器

    補充說明

    產出的檔案為副檔名為.LOG的檔案

    記錄了座標及時間,因此搭配數位相機時,需注意兩時間的對時

    ===================================================

    圖四、測試後用廠商給予的API將照片傳送至GOOGLE MAP

    ================================================================================

    完成後的感想

    在測試的期間,剛好電視正在播報一則新聞,一個被打重傷的民眾用僅存的力量透過手機報警,

    ,警方鎖定發話範圍,即時搶救回一條實貴的生命。

    在每個山友出發前配置一個發信器記錄期路徑軌跡,發生山難或失蹤時 

    有沒有可能透過發信器的位置利用相關的演算法確切的堆算掌握位置,

    從一座山的一點,縮小為一個山谷,再堆到半徑5公尺內,縮短尋找的時間,增加尋救的可能

     

     

     

    Lab T5 : Exercise.9-5

    組別:第二組  

    組員:許復凱 劉凱銘 許聆容

     這一章是利用比對交友的一些資料,來判定兩個人是否適合。所包含的資料欄位有兩人的一些基本資料,包含了地址,課本上的地址是利用Yahoo API去抓到經緯度的數值,再把全部的欄位數值轉成數值型態,再去做比對,把資料做scale到0和1之間再去計算。再利用SVM的演算法去做分類,課本上的SVM模組要安裝到Python25很麻煩,因為他是用svmc.pyd去代替dll檔,我把這個檔案丟到每一個可能存在的資料夾底下,最後才裝上去。

    Kernel_type=LINEAR

    Kernel_type=POLY

    在Matchmaker Dataset分析當中,但是我卡在剖析XML的時候都會出現錯誤訊息

    否則下面的指令應該可以正確的將對應的Kernel_type=POLY的最後結果跟Kernel_type=LINEAR兩個做對比

     若是上面XML有剖析過的話,下面的指令應該為

    answer,input=[r.match for r in scaledset],[r.data for r in scaledset]

    param=svm_parameter(kernel_type=POLY)

    prob=svm_problem(answers,inputs)

    m=svm_model(prob,param)

    呈現出最後的結果可以進行後面預測值的精確度

    Lab T3 : Exercise.7-3

     

    組別:第二組  

    組員:許復凱 劉凱銘 許聆容
    在建立決策樹的時候最擔心的就是有miss data會影響到整個結果,最後所預測出來的值會變有問題,若欄位值屬於數值性的,則在分類資料會較快速,但是欄位值屬於連續數值(離散值),在決定樹的分支點必須考量到比較多的因素,一般最常做的是利用entropy去做分割點的計算,那是因為數值性的資料,離散值較常利用的是Gini的計算方式。

    課本上利用探勘使用者對於網頁瀏覽的次數來預測使用者會成為網頁的哪一種消費者(None,Premium,Basic),大部分的欄位都是屬於兩三種類別,只有在Pages viewed是屬於離散值

    同樣得資料上面是用weka以節點為Pages viewed當作root以J48所建立的樹,其他節點是以location作為分類終端節點

    整個結果

    Correctly Classified Instances          12               75      %
    Incorrectly Classified Instances         4               25      %
    Kappa statistic                             0.6484
    Mean absolute error                      0.1705
    Root mean squared error                  0.292
    Relative absolute error                 47.0443 %
    Root relative squared error             68.8266 %
    Total Number of Instances               16    

    同樣得資料上面是用weka以節點為Pages viewed當作root以J48所建立的樹,其他節點是以location作為分類終端節點 

    Correctly Classified Instances          11               68.75   %
    Incorrectly Classified Instances         5               31.25   %
    Kappa statistic                              0.596
    Mean absolute error                      0.1536
    Root mean squared error                  0.2771
    Relative absolute error                 48.8636 %
    Root relative squared error             70.0543 %
    Total Number of Instances               16    

    所以可以知道若是先以root為Pages viewed所得到的精確度會較高

     這裡的root就是所謂的離散型資料,這裡的結果是以12作為分割節點的次數

    課本上是要以commendline的方式,每一個","表示對應到不同欄位的值,在根據所建立的樹去找最後的結果

    對於某些欄位會出現miss data,所以整的演算法同樣會去利用"None"去計算最後的結果

    期未報告:Towards Context-Aware Mobile Web 2.0 Service Architecture

    姓名:任祥偉,班級:碩職二,學號:496515029

    一、簡介

    隨著網路技術的發展,網路的應用越來越豐富,發展者的認為之後的網路服務可以越來越貼近電腦上的應用程式,而這些應用程式也可以靈活的與其他服務結合成為新的服務。
    在行動裝置的網路服務中,context awareness的技術可以察覺出目前在行動裝置上的狀況,並將之轉換為可用的資訊,這些資訊可以上傳到web serivcie中,結合社群網站的服務與朋友交換分享,豐富了網路社群的服務內容。

    context的定義是” 任何可以用來描述一個實體的情況的信息”,以常見的即時通訊的服務為例,使用者可以依據連絡人清單的狀況決定開始或不開始與連絡人通訊。context awareness的技術,特別適合用在輸入能力和銀幕尺寸被限制的行動環境下,由於行動裝置都是跟使用者在一起,行動裝置的context也會隨著使用者的使用環境而有所不同,成為一項豐富的背景資料。
    當大量的行動裝置變成感測器時,從網路上來的大量context資料及使用者的本身的context可以被用來自動地配置服務。

    為了建立context aware的Mobile Web 2.0服務,我們提出了隨插即用的應用平台(Plug and Play Application Platform ,PnPAP)的概念,PnPAP是指一個模組化的中介程式元件,我們可以利用此元件,透過抽象的通訊協定、session及connectivity的管理來加快應用程式的開發,類似SOA的架構,可以將service快速的更換,以其他的service取代。
    PnPAP可以利用一群共同的函數來分享context的資訊,就像管理sessions及connectivities一樣,舉例來說,社群成員可以選擇其他成員去開始新的應用sessions,來做檔案分享,訊息傳送或即時通訊等應用。

    二、context aware mobile Web 2.0 服務架構的元件

    使用者的context,社群及身份認證可以被收集起來,透過行動的中介軟體傳到web service上。為了保障操作上的安全,存取這些資訊必須要經過一個可靠的元件,比方說一個特定的control service。這樣的操作可以達到「單一登入」的功能,使用者可以透過單一登入的方式使用不同的網路服務,原理如同Microsoft Passport Network。
    Web service可以透過control service去取得使用者的context及社群的資訊,如此一來就可以更容易的利用其他web service的特別功能,形成新的mash up服務,如圖1所示。

    圖1 Context-aware mobile Web 2.0 服務架構的元件

    使用者可以實際看到多功能的mash up服務。在圖中,每個End-User Terminal和Mash-up Service有一個唯一的標識符號,用來連結服務session的具體context和社群資訊。
    Control service也可作為提供Mash-up服務的入口(search discovery)。此外,Mash-up服務應當提供工具給使用者,讓使用者能確定mash up的服務同時也讓其他用戶可以存取到他的context和社群資訊。我們也可以根據當地的情況調整要提供的資料。例如,用戶可能只有在能快速的連接WLAN時,才需要提供她的位置資訊。
    一般來說,所有的mash up服務都可以不需要額外的context和社群資訊,但是這樣就可能無法得到相同的結果 (例如,在社群中的位置 )。這可能會鼓勵使用者開放他的其context,以便能使用更順暢的服務。

    2-1中介軟體

    每個使用者的行動裝置上都執行了中介軟體的元件,可以控制 P2P的存取及context的傳送,如圖2所示。中介程式可做為流覽器的一部分,或是獨立的處理流程。雖然獨立的流程最容易實現,但是當瀏覽器的功能與中間程式的功能緊緊相依時,則必需將這兩樣一起執行。
    中介程式收集了local的context資訊,並且在提煉之後分享在網路上。提煉的意思是指將必要的資訊從原始的區域背景資料中取出,並以通用的格式表示,以便其他node識別。中介軟體也要管理P2P網路中內容瀏覽或社群管理的網路協定。


    圖2 行動中介軟體的設計

     


    三、服務及傳送context與社群資訊的通訊模型

    在這個架構中,我們需要傳送的資訊有兩個類型:1.可用的Web 2.0 mash up 服務。2.使用者context及社群的資訊。而要傳送這些資訊的方法有二種:集中或分散(P2P)的方式。如此一來,我們將獲得四個不同的組合,描述於表1之中。

      service  Context and community information
    Centralized Control  Centralized  Centralized
    Centralized services  Centralized  P2P
    P2P services  P2P  Centralized
    Pure P2P  P2P  P2P


    表1 傳送服務及使用者context及社群資訊的模型



    首先,從瀏覽器直接地傳送背景資訊給mash up服務似乎是最合適的。對比於上述的四個方法,這個方式不需要在行動中間程式與瀏覽器之間的溝通。
    這個想法和PnPAP相同(讓瀏覽器變得像是PnPAP服務的一項應用程式)。但是在這個model中有一個主要的問題,它需要瀏覽器去存取local user背景及社群資訊,這樣會降低應用程式的可攜性。以下介紹上述的四種不同的模型。

    3-1 Centralized Contrl(CC)

    第一個傳遞使用者背景及社群資訊的方法是加強control service與資料庫的能力。行動中間程式應在適當的間隔下更新使用者資訊到控制服務,如圖3。


    圖3 集中控制的模型

    mash up服務可以利用control service所提供的介面去要求使用者的資訊。這個方法的問題是,要如何高效率的傳遞使用者context及社群資訊。當Control service遭遇大量的行動使用者要求更新其使用者資訊時,Control service也很明顯的會成為瓶頸。再者,mash up服務也會要求control service要持續的提供使用者的context及社群資訊。由中央提供及管理全部的資訊,能確保儲存的安全性也能準確的得到要求的結果。Control service有能力決定哪些mash up服務要給peers使用。

    3-2 Centralized services(CS)

    在P2P網路中分散的大量資源可以用來取代利用中央儲存及傳遞使用者context及社群資訊。使用者資訊被組織成可以放在P2P網路上被行動中間程式所使用的格式。Mash up 服務將要求P2P網路要透過一些control service作為像閘道的功能,以得到使用者的背景與社群資訊。control service被用來從不同的serivce提供者之間結合不同的P2P網路,如圖4所示。這就是為何需要數個control services的原因。

    為了達到有效率的要求處理,網路負載必須平均地劃分,且需慮到不同peer的性能。在有效率的網路設計中,分享的peer應該被組織成階層式的架構。Peer有巨大的處理性能及頻寬的Peer被設為superpeer,管理訊息路由及儲存使用者的資訊。


     圖4 集中服務的模型

    3-3 peer-to-peer services(PS)

    另一種方法是將使用者背景及社群資訊保留在中央,但是讓mash up服務分散,透過P2P網路搜尋mash up服務。當mash up service被一個建全的,分散的superpeer索引到時,中央資訊管理的架構可以使得存取資料較為容易並且更為安全,如圖5所示。
    XML Configuration Access Protocol(XCAP,XML結構存取協定)可以被視為最主要的角色,在這類方法中。XCAP server維持一個XML文件包含每個使用者及每個應用程式的資訊資源,可用於在應用程序中的具體方式。

    圖5 P2P服務的模型

    XCAP試圖支援需要多個同時存在的應用的結構,而不只是單一個應用。XCAP允許使用者從不同的客戶裝置中存取他們的資源列表。在Web 2.0 mash up的案例中,XCAP的資源可以被用來維護使用者列表及他們的預先服務偏好。Peer有能力決定他們要用的mash up (就像相反的CC model)

    3-4 Pure perr-to-peer

    第四個方法,是網路被組成完全的P2P網路。網路服務也成為了P2P網路的一部份,如圖6所示。在研究中指出,具有多功能即時訊息軟體類型的client (或類似的通訊軟體)將被當做mash up服務的入口,它會被升級成為具有服務搜尋及權利控制的能力。即時通訊類型的client會成為主要選擇的原因,是因為較多的使用者已經熟悉它們的用法。瀏覽器不能透過使用者的context及社群資訊來管理權利,因為權利已被轉換成獨立的context資訊。
    Service 的探索可以透過IM client在P2P網路中創造search query來管理,或是使用者可以在彼此之間互相傳送新的service連結。IM client將會為mash up服務以及社群設定存取的權利。例如:IM Client可以給釋放權利給地圖的服務,使其可以存取local使用者的位置資訊。當權利設定完成,IM client就可以直接在local瀏覽器內啟動服務。
    如果使用者在搜尋網站時發現一個新的mash up服務,mash up服務可以經由P2P網路要求適當的存取權利。request將突然出現在IM client上,此時使用者可以接受或拒絕要求。Mash-up服務將需要使用者唯一的ID使能其獲得request。傳遞ID從使用者到Mash-up應該不難,但仍需用安全的方法實行。


    圖6純粹的P2P模型

    這個方式的主要優點是不太需要中央管理(沒有急迫的需要操作者控制)。P2P網路可以被一個操作者維護,但是只有在使用者認證時需要嚴謹的控制。
    Control service可以被分割到多個使用者之中,在這個案例中,為了確定被指定的是全區唯一的使用者識別符號,在不同使用者之間的內部操作能力必須要能被保證。搜尋效率及資料有效性也必須被保證,因為大部分context資訊在短時間內被淘汰。除此之外,安全及隱私也是分散式資料管理的問題之一。

    四、結論

    在Mobile Web 2.0的設計中,context aware的技術要算是最適合於行動裝置使用的,因為行動裝置的特色就是它的使用環境無時不刻在變化,這一篇文章中提到利用一個輕量的中介軟體來傳達context及社群的資訊,這樣可以方便使用者快速的將context資料在社群之間分享,同時也能讓web service的內容更加的豐富。
    透過中介軟體可以做到集中式或是分散式的資料管理,配合需要傳送的context資訊及web service的資訊,會產生四種網路的模型。
    集中式的管理具有高度的資料安全性及易於搜尋的特色,但是做為入口的control service可能會成為瓶頸,資料的傳遞也不如分散式的資料管理靈活。分散式的資料管理具有靈活的資料傳遞特性,但是相對的問題也較多,如安全性的問題,web service搜尋的問題,都有待克服。
    但是P2P的網路架構有較大研究空間,將來可以朝向設計中間軟體並建立P2P的網路進行研究。

    骨董級分散式運算案例: SETI@HOME

    SETI@HOME是一個骨董級的分散式運算案例, 他們的目的很複雜, 透過天文望遠鏡從外太空收集來的微弱資訊, 然後做一些對應的處理後, 再進行分析的動作, 換成我們"凡夫俗子"的話就是"找外星人啦"...

    這個計畫一開始是由UC Berkeley建立一群電腦來負責做即時的運算, 但漸漸的他們發現這些電腦根本不足以運算這麼大量的資訊, 那這個問題該怎麼解決呢?

    當時的他們發現到, 世界上有許多電腦是處於閒置的狀態, 如果能利用這些電腦閒置的時間來幫忙做這些運算, 那勢必能夠有效地解決這個問題.

    很幸運地, 這些尚未處理的資訊, 是可以切割的, 他們將這些收集到的資訊切割成很小的碎片, 分給世界各地的電腦, 利用這些電腦閒置的時間來運算這些尚未處理的"電波"(我不知道該如何稱呼這個東西:p), 當這些電腦運算完之後再將結果透過網路回傳給server去做更深入的研究.

    這是很早期的分散運算概念, 且可算是一個成功的案例. 因為他們並不會利用電腦非閒置的時間來做任何的運算動作(當然, 這是預設的情況下), 所以並不會影響到使用者的個人電腦效能, 僅是利用短暫的"休息"時間進行運算. 

    現在這個計畫的client已經併入到BOINC底下, 有興趣的人可以去安裝它的client, 預設情況下它並不會啟動, 但一旦電腦進入螢幕保護程式時他就會醒來幫你的CPU運動一下, 排除掉現在節能減碳的觀念不談, 至少是個很有效率的利用方式.

    雖然這個主題與雲端運算關係不大, 但還算是個滿有趣的主題, 一樣也是利用分散運算的概念來集合這些CPU的資源.

    Apache Hadoop

    現在大家嘴巴都喊著cloud cloud cloud, 那有沒有什麼東西是能讓我們親自體驗的呢?

    Apache推出了open source的platform Hadoop一陣子了, 它也是將數台實體機器做成一個虛擬平台, 也就是我們現在常提到的cloud.

    有興趣的話可以去參考它的教學文章, 感覺設定上並不會太過困難, 照這它的getting start step by step即可,

    http://hadoop.apache.org/core/

    Yahoo!在前陣子也開始加入這個open source的開發.

     

    但話說回來, 到底要到什麼樣規模的服務, 才有需要建置這種cloud? 對於Yahoo來說, 他們的運算成本是降低了, 因為比較起來, 超大型機器的建置及維護費用遠高於cloud中的一台小的實體機器, 但反觀一個小服務, 例如輔大資工的網站, 有必要把這個服務建置到cloud上嗎?

    當然這個例子的答案是很顯而易見的, 不過如果今天公司裡的server是處在很尷尬的階段, 3台, 5台, 10台, 那是要把這幾台機器全用Hadoop串在一起好, 還是用一台超級伺服器來取代比較好? 相信這也是會有一定程度的成本考量, 不論是未來的硬體維護, 及人力維護成本(不同的架構所需要的人才價格當然不同)

    但這勢必是個趨勢

     

    Verizon手機將採用微軟手機搜尋服務

    微軟的Windows Mobile OS,其設計的界面和PC/NB上的Windows OS可說是操作方式非常的雷同!其實,微軟的企圖意味非常的明顯,就是想靠著PC/NB的廣大作業系統的市場,也為自己在Mobile Device的市場搶下一席之地!而在網路搜尋技術遠遠落後Google、Yahoo的同時!收購Yahoo的計畫又失敗,想當然爾,此時此刻能夠和美國行動營運商Verizon簽下五年的Microsoft Live Search長約,無疑的是對微軟的一劑強心針!同時讓微軟在Mobile Device的市場上更佔有一席的地位!

    Verizon手機將採用微軟手機搜尋服務

    文/陳曉莉 (編譯) 2009-01-08

    <!-- NO MAIN PHOTO -->對在網路搜尋市場苦苦追趕Google及Yahoo的微軟而言,與Verizon的此一協議無疑是項勝利。

    美國行動營運商Verizon在周三(1/7)宣布已與微軟簽訂五年的合作協議,將在Verizon新的行動電話及智慧型手機中提供Windows Live Search服務,該合作計畫在今年上半年啟動。

    對在網路搜尋市場苦苦追趕Google及Yahoo的微軟而言,與Verizon的此一協議無疑是項勝利。Verizon的行動用戶將能透過行動網路服務下載Microsoft Live Search,同時微軟也將負責Verizon行動網路服務的搜尋及陳列式廣告,不過雙方並未透露此次合作的財務細節。

    根據華爾日報報導,微軟必須保證雙方合作五年間Verizon可獲得的廣告收入,金額估計在5億美元至6.5億美元之間。

    Verizon說明,該公司的行動用戶將能根據行動裝置的類別,透過語音或輸入查詢字串,或使用區域搜尋功能找到相關資訊,諸如地圖、交通資訊、電影院及電影放映時間、油價、天氣或商家等,或是搜尋新聞及娛樂內容。

    Verizon行銷長John Stratton表示,該公司有愈來愈多的無線網路用戶利用手機存取網路,而包含企業的資料傳輸或是連到多媒體服務等無線資料傳輸已佔該公司25%的營收。

    微軟積極推廣旗下Windows Live網路服務,Windows Live涵蓋各種網路服務元件,除了搜尋服務外,還包括即時傳訊、電子郵件,及網路相簿等,微軟亦在周三宣布戴爾電腦(Dell)將自2月開始提供預載Windows Live各種元件的個人電腦,而社交網站Facebook則將在未來幾個月內讓使用者在該站分享儲存於Windows Live的照片等內容。(編譯/陳曉莉)

    期末報告

    目前搜索引擎考量到只能以很短的單字去做Query(inverted list,每個單字為單獨建),若要以圖片作搜尋引擎的檢索,等於是將一個document丟到search engine去做query,並且在整個機器做計算,傳統的搜索引擎大部分花費的時間在crawl 全部pagesuser,但是最終給user只會有百分之一,其他都會浪費掉,若從原有的搜索引擎結構去做Multimedia Search必須去做改良,利用Search是可以最快直接得到用戶的intension,這就牽扯到long query的問題,必須處理大量的資料來從大量的圖片當中找到所要的圖片,傳統的Page Rank演算法,就是會利用去評估每個pageweight去給user較重要相關的page,但是他只能處理short query,一個images有一千個local feature,要將大量的資料去做降維(壓縮完再index)找到重要的data,很容易會丟掉一些重要的資料。

    一般的inverted list

    上圖inverted list (出自LARGE SCALE MULTI-TYPE INVERTED LIST INDEXING, Joerg Meyer)LSH Locality Sensitive Hashing(此段出自於於邱一航等人,以圖像內容為基礎的重製圖像偵測與追蹤系統 使用概似最近搜尋法) LSH主要的想法為空間中的每一個點經過雜湊函數的計算,可以讓每一個點與較相近的點碰撞的機率提高,反之若兩點的距離很遠則碰撞的機率則會下降。所以在查詢時,可以藉著雜湊函數來判斷鄰近的點,並且從雜湊桶裡得到所需相近點的資料。LSH在動態修改方面,如插入,刪除和修改點等功能,相當容易使用,時間複雜度也不高。LSH文獻中主要探討都使用歐氏空間來計算兩點間的距離,但是也可依據使用不同情況下,使用不同的距離計算公式,來定義不同LSH的雜湊函數,判斷點與點之間的相近程度。 LSH是由IndykMotwani所提出,其主要目的在於解決在多維空間中搜尋某ㄧ點的臨近點之問題。LSH在多維度的空間中,搜尋最近相鄰點時,其時間複雜度,會小於線性搜尋法的複雜度。Topic model (LDA)visual space 找到subspace,每一個subspace都是一個topic model,把所有document重新project到那裏,然後用hashing的方法建index,因為是做壓縮很多東西會移失,上圖o 跟+是兩個不同的class,用PCA 求出降維後的basis,會使所有data 投影到那basis 產生的error (Euclidean distance)最小。另一方面,Fisher LinearDiscriminate (LDA) 所產生的basis 就不一樣了,你可以看得出來o 跟+被投影LDA basis 上時,有明顯被區分成兩群的情況,我們可以在投影過後的space中,決定出一個點把兩群資料分開!而PCA 投影過後的data 沒有辦法決定一個點把兩群資料分開。Long document retrieval所以將文件分為三個部分:1. document specific word (每個document是唯一的與標題相關)2.topic specific word(search keyword相關的) 3.background/stop word(多餘的內容)驗證subspaceBasic ideal: Document Decomposition1.      藉由PCASVD,一個文件p可以代表為p=m+Xw 這裡的pm 都是兩個W維度的特徵向量,X是一個W藉由K矩陣所得到的,wp重新建置的系數2.      兩個文件的內積(為了要移除mean)

     

     

    p=m+Xw+

    Decomposition model

     

    Ranking Engine

     

    Cloud computing with search 大部分傳統的搜尋沒有辦法將user所搜尋的資料進行儲存,每一次的搜尋都必須重新去計算,並且是以pipe line的方式進行

     

    1.      每一次會將網頁進行crawl,將資料進行除了後取出所要的data,再將data去建index,不斷的重複,沒有辦法將每一次所crawl的資料進行儲存。2.      並且是緊偶合的架構,只要部分結構改變全部其他也必須跟著去改變。Search engine分為三個系統A.          Offline experience(系統會經由內部的開發人員去做建置和開發)B.          Online experience(將系統開放出來進行測試,得到結果進行改良)C.          Production(以產品的方式推出,得到結果的回饋)Layered Infrastructure for search

     

    1.      變的有記憶力2.      技術轉移可以藉由data transfer,讓整個效能改善

     

    Web-scale Multimedia analysis for search

    把所有相關的數據算法變成類別庫,把meta data 存起來後,然後互相share和交換,定時將結果Knowledge傳到pipe line理,讓效能更重要Reference[1]. LARGE SCALE MULTI-TYPE INVERTED LIST INDEXING, Joerg Meyer, March 2005[2]. 以圖像內容為基礎的重製圖像偵測與追蹤系統 使用概似最近搜尋法 ,邱一航 ,2006,第五屆數位典藏[3]. Large-scale Multimedia Analysis and Similarity Search, Wei-Ying Ma(Microsoft research) ,2008,Emerging Technologies in Digital Media

    Term Project -- 網路服務

    資工碩一/497516082/王祥宇

    我的present內容部分非技術性細節我想礙於某些內容不便發表於公開平台, 簡單簡述如下,

    想靠網路創業嗎? 想做個網路服務來賺錢嗎?

    我相信沒有任何一種創業是一定成功的, 也沒有任何一種創業是輕鬆的, 過程中一定都有它困難的地方.

    簡單的來說, 網路創業與其他創業類型一樣, 需要一個很好的idea, 需要一個夠大的市場, 需要幾顆不需要很聰明但可靠的頭腦, 最重要的還是需要很多很多的錢. 

    20萬創業變成2000億的大公司的夢現在已經不容易實現了, 每個位置都已經有人站好腳步, 要如何在這種環境中站穩腳步, 創造出自己的另一個奇蹟是不容易的事情. 

    web2.0的網路服務, 最常被人問到的問題就是"你們的收入從哪來?", 相信大家的回答都是差不多的, "廣告"應該是絕大部分的答案, 但實際上做起來,要讓別人肯花錢丟廣告在你的服務平台上是非常不容易的事情, 那除了廣告之外, 還能讓收入從哪裡來呢? 難道有人創業只為了理想, 夢想, 而不希望有任何收入的嗎? 

    有關於網路服務的商業模式, 我想也是另一個學問, 或是經驗談, 礙於我們也不是商學院的學生, 這些東西就留給更專業或更有經驗的人來分享吧.

    ---------------------------------------------------------------------------------------------------------

    有關開發的內容發在下一篇內容中...

    Term Project Report:Pocket Controller 簡介

    Pocket Controller 簡介

    碩職二  496515225  劉凱銘

     

    需求:
        * 兼容所有運行微軟Windows Mobile , Windows CE的, Pocket PC或Smartphone操作系統的設備

    系統:
        * Windows XP, Vista, Windows 2000 desktop or server 作業系統的PC or NB
        * ActiveSync 4.1 or later

    Overview:
     Pocket Controller-Pro可以透過使用您的桌上型電腦的屏幕,鍵盤和滑鼠來查看和控制您的移動設備的掌上控制器

    功能:

         *連接:可以透ActiveSync和TCP/IP protocal 來和Device連接。可以同時進行多個連線!
         *裝置外層:查看您的移動設備中的設備的Skin,Skin對大多數的Windows Mobile ( Pocket PC和Smartphone)是可以利用的裝置。
        * 全螢幕背景模式:View the remote control session against a solid color or HTML background, ideal for presentations
        * 縱向或橫向顯示模式:查看您的移動設備屏幕上的縱向或橫向的模式
        * DOS 視窗:使用的DOS等工具來遠程執行DOS命令
        * 剪貼同步:在設備和桌面電腦中進行傳輸數據移動 。這一設施允許的數據可以方便地交換了台式電腦和設備之間的應
        * 指令的記錄/播放:記錄擊鍵和鼠標活動,以指令的檔案可以播放。指令檔案的文本文件,可以修改和自定義
        * Automatic Startup:Can be configured to automatically start/stop when you dock/un-dock your mobile device profiles, multiple TCP/IP addresses, control multiple devices simultaneously by running multiple instances of Pocket
    自動啟動:Device可以為自動啟動/部分停止時,當您的移動設備dock/un-dock設定檔案,多個TCP / IP地址,控制多台設備同時運行多個的實例。

    控制:
        * 支持所有國際鍵盤
        * 10個月的免費升級和技術支持


     

    <!-- File Synchronization -->

    <!-- Registry Editor -->

    <!-- Task Manager -->

    google map與歷史結合

    之前引起相當程度討論的電影:赤壁。目前即將推出下集了。

    而google map上推出赤壁的古地圖的服務,

    讓不了解三國歷史的人,也可以透過google map的服務來認識歷史。

    赤壁 on Google Map

    在地圖中除了介紹主要人物的生平外,

    更將他們曾發生的歷史事件經過以圖形的方式呈現在地圖上,

    方便讀者比照時間及地理位置,讓我們對歷史更有感覺。

    網址:http://maps.google.com.hk/redcliff

     

    當然這是從歷史的觀點來看待這個服務,

    但若能結合電影或小說,將之與google map結果,

    例如:將電影「環遊世界80天」的故事與地圖結合,

    就能知道主角環遊世界的經過了。


     

    Mashup安全性

    我們可以透過Mashup得到別人的資料,或許我可以把那些攝影大師級的作品Mashup過來,把我自己佯裝成攝影專家,欺世盜名,說不定也會產生一堆我的粉絲,也許我可以利用這些人做更近一步的商業手段或是詐欺等行為。隨著數位內容越來越普及,所產生的篡改、複製、誤用的問題越來越嚴重,我想我們應該要正視此問題。

    訂閱文章