中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大數據中的數據挖掘與建模是怎樣的

發布時間:2022-01-18 10:45:33 來源:億速云 閱讀:150 作者:柒染 欄目:大數據

這篇文章主要為大家分析了大數據中的數據挖掘與建模是怎樣的的相關知識點,內容詳細易懂,操作細節合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學習“大數據中的數據挖掘與建模是怎樣的”的知識吧。

紙上得來終覺淺,絕知此事要躬行。  

數據挖掘是基于統計學原理,利用機器學習中的算法工具實現價值信息的發現。機器學習是一種實現人工智能的方法,深度學習是實現機器學習的一種技術。

四大經典算法:分類、關聯、聚類、回歸

一、監督學習  (通俗來說就是已知樣本類別,即知道當前的樣本是哪一類的樣本。)

1、分類分析:找出一組對象的共同特點并按照分類模式將他們分為不同類,分為線性分類和非線性分類。

線性分類典型的算法包括邏輯回歸和線性判別分析。
非線性分類經典算法包括K近鄰(KNN)、支持向量機(SVM)、決策樹(D Tree)、樸素貝葉斯(NB)
2、回歸分析:反映事務數據屬性在時間上的特征,預測數據間的相關關系,與分類區別在于,分類是預測目標的離散變量,而回歸是預測目標的連續變量。
典型的回歸分析模型包括線性回歸分析、支持向量機(回歸)、K近鄰(回歸)。

二、無監督學習(事先沒有任何訓練數據樣本,需要直接對數據進行建模,即不提供經驗和訓練樣本,完全靠自己摸索)

1、關聯分析:描述數據庫中數據之間存在關系的規則。
關聯規則挖掘中有4個指標:置信度、支持度、期望置信度、提升度。
典型算法:Apriori算法、FP-Tree算法、PrefixSpan算法。
2、聚類分析:訓練樣本標簽信息未知,通過學習揭示數據內在性質及規律。
典型算法:K均值算法(K-means)、DBSCAN(具有噪聲的基于密度的聚類方法)。

三、沃爾瑪經典營銷案例:啤酒與尿布

模型發現:  20世紀90年代的美國沃爾瑪超市中,管理人員分析銷售數據時發現了一個令人難于理解的現象:  在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關系的商品會經常出現在同一個購物籃中。
原因分析:  在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。  父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現在同一個購物籃的現象。
模型應用:  在賣場嘗試將啤酒與尿布擺放在相同的區域,讓年輕的父親可以同時找到這兩件商品,并很快地完成購物;  而沃爾瑪超市也可以讓這些客戶一次購買兩件商品、而不是一件,從而獲得了很好的商品銷售收入。
理論支撐:  1993年美國學者Agrawal提出通過分析購物籃中的商品集合,從而找出商品之間關聯關系的關聯算法,并根據商品之間的關系,找出客戶的購買行為。  艾格拉沃從數學及計算機算法角度提 出了商品關聯關系的計算方法——Apriori算法。

關于“大數據中的數據挖掘與建模是怎樣的”就介紹到這了,更多相關內容可以搜索億速云以前的文章,希望能夠幫助大家答疑解惑,請多多支持億速云網站!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阳春市| 南昌市| 泉州市| 遵义县| 北京市| 门头沟区| 仁布县| 孝感市| 伊通| 仪陇县| 深州市| 德保县| 莎车县| 绥棱县| 北流市| 左贡县| 镇赉县| 赫章县| 洛扎县| 嘉黎县| 延安市| 天峻县| 塘沽区| 台南县| 鹿泉市| 加查县| 合山市| 渑池县| 洞头县| 屏东县| 遂溪县| 句容市| 银川市| 来宾市| 翼城县| 大宁县| 衡阳市| 新疆| 沾化县| 车险| 马龙县|