567彩票

您所在位置網站首頁 > 海量文檔  > 專業論文 > 計算機論文

【原創】PyTorch機器學習分類預測銀行客戶流失模型數據分析報告論文(附代碼數據).docx 30頁

本文檔一共被下載: ,您可全文免費在線閱讀后下載本文檔。

  • 百度一下本文檔

下載提示

1.本站不保證該用戶上傳的文檔完整性,不預覽、不比對內容而直接下載產生的反悔問題本站不予受理。
2.該文檔所得收入(下載+內容+預覽三)歸上傳者、原創者。
3.登錄后可充值,立即自動返金幣,充值渠道很便利
特別說明: 下載前務必先預覽,自己驗證一下是不是你要下載的文檔。
  • 上傳作者 lico9e(上傳創作收益人)
  • 發布時間:2019-11-08
  • 需要金幣90(10金幣=人民幣1元)
  • 瀏覽人氣
  • 下載次數
  • 收藏次數
  • 文件大小:112.19 KB
下載過該文檔的會員
你可能關注的文檔:
【原創】定制代寫開發r/python/spss/matlab/WEKA/sas/sql/C++/stata/eviews/Computer science assignment代寫/代做Project/數據挖掘和統計分析可視化調研報告/程序/PPT等/爬蟲數據采集服務(附代碼數據), 咨詢QQ:3025393450 有問題到百度搜索“大數據部落”就可以了 歡迎登陸官網:/datablog PyTorch機器學習分類預測預測銀行客戶流失模型數據分析報告 分類問題屬于機器學習問題的類別,其中給定一組功能,任務是預測離散值。分類問題的一些常見示例是,預測腫瘤是否為癌癥,或者學生是否可能通過考試。 在本文中,鑒于銀行客戶的某些特征,我們將預測客戶在6個月后是否可能離開銀行。客戶離開組織的現象也稱為客戶流失。因此,我們的任務是根據各種客戶特征預測客戶流失。 $ pip install pytorch 數據集 我們將在此 Kaggle鏈接中免費提供本文中將要使用的數據集。讓我們將所需的庫和數據集導入到我們的Python應用程序中: import torchimport torch.nn as nnimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns %matplotlib inline 我們可以使用庫的read_csv()方法pandas來導入包含我們的數據集的CSV文件。 dataset = pd.read_csv(r'E:Datasets\customer_data.csv') 讓我們打印數據集 : dataset.shape 輸出: (10000, 14) 輸出顯示該數據集具有1萬條記錄和14列。 我們可以使用head()pandas數據框的方法來打印數據集的前五行。 dataset.head() 輸出: ? 您可以在我們的數據集中看到14列。根據前13列,我們的任務是預測第14列的值,即Exited。? 探索性數據分析 讓我們對數據集進行一些探索性數據分析。我們將首先預測6個月后實際離開銀行并使用餅圖進行可視化的客戶比例。 讓我們首先增加圖形的默認繪圖大小: fig_size = plt.rcParams["figure.figsize"] fig_size[0] = 10 fig_size[1] = 8 plt.rcParams["figure.figsize"] = fig_size 以下腳本繪制該Exited列的餅圖。 dataset.Exited.value_counts().plot(kind='pie', autopct='%1.0f%%', colors=['skyblue', 'orange'], explode=(0.05, 0.05)) 輸出: ? 輸出顯示,在我們的數據集中,有20%的客戶離開了銀行。這里1代表客戶離開銀行的情況,0代表客戶沒有離開銀行的情況。 讓我們繪制數據集中所有地理位置的客戶數量: sns.countplot(x='Geography', data=dataset) 輸出: ? 輸出顯示,幾乎一半的客戶來自法國,而西班牙和德國的客戶比例分別為25%。 現在,讓我們繪制來自每個唯一地理位置的客戶數量以及客戶流失信息。我們可以使用庫中的countplot()函數seaborn來執行此操作。 sns.countplot(x='Exited', hue='Geography', data=dataset) 輸出: ?? 輸出顯示,盡管法國客戶總數是西班牙和德國客戶總數的兩倍,但法國和德國客戶離開銀行的客戶比例是相同的。同樣,德國和西班牙客戶的總數相同,但是離開銀行的德國客戶數量是西班牙客戶的兩倍,這表明德國客戶在6個月后離開銀行的可能性更大。 數據預處理 在訓練PyTorch模型之前,我們需要預處理數據。如果查看數據集,您將看到它具有兩種類型的列:數值列和分類列。數字列包含數字信息。CreditScore,Balance,Age等。類似地,Geography和Gender是分類列,因為它們含有分類信息,如客戶的位置和性別。有幾列可以視為數字列和類別列。例如,該HasCrCard列的值可以為1或0。但是,那HasCrCard列包含有關客戶是否擁有信用卡的信息。 但是,這完全取決于數據集的領域知識。 讓我們再次輸出數據集中的所有列,并找出哪些列可以視為數字列,哪些列應該視為類別列。columns數據框的屬性顯示所有列名稱: dataset.columns 輸出: Index(['RowNumber', 'CustomerId', 'Surname', 'CreditSc

發表評論

請自覺遵守互聯網相關的政策法規,嚴禁發布色情、暴力、反動的言論。
用戶名: 驗證碼: 點擊我更換圖片

“原創力文檔”前稱為“567彩票”,本站為“文檔C2C交易模式”,即用戶上傳的文檔直接賣給(下載)用戶,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有【成交的100%(原創)】。原創力文檔是網絡服務平臺方,若您的權利被侵害,侵權客服QQ:3005833200 電話:19940600175 歡迎舉報,上傳者QQ群:784321556

新彩网-新彩网注册-新彩网网址 太子彩票-太子彩票注册-太子彩票网址 五百万彩票-五百万彩票注册-五百万彩票网址 快3彩票-快3彩票平台-快3彩票官网 辉煌彩票-辉煌彩票平台-辉煌彩票官网 同花顺彩票-同花顺彩票投注-同花顺彩票注册