Welcome 歡迎光臨! 愛上網路 - 原本退步是向前

人工智慧資料處理

常見的資料分析演算法

  •  線性迴歸做趨勢預測
  •  決策樹做分類
  •  最近鄰居法做分類(KNN)
  •  平均法做分群(平均值分K群)

 

資料處理

  • 資料清理(Data Cleaning),顧名思義就是把不需 要的資料去除,而資料清理又可分成去除不要的「欄位」與去除「異常值」。
  • 資料視覺化(Data Visualization)指的是用視覺的方式呈現資料,讓我們能夠 辨別數據的趨勢、規律和關聯性。

 

C ) 2. 俗語說:「物以類聚」,想判別一個人是怎樣的人,常常可以從他身邊的朋友著手,這樣的分析方法,跟以下哪一種資料分析方法很像?
(A)迴歸分析 (B)二元樹 (C)最近鄰居法 (D)決策樹。

( D ) 3. 電腦科學家嘗試「教」電腦如何辨識動物,於是想到取出動物的特徵來反覆訓練電腦,這樣的過程,我們稱為以下何者?
(A)動物學習(B)人工學習 (C)翻轉學習 (D)機器學習。

( B ) 4. 下列何者是最近鄰居演算法常面臨的困難?
(A)資料量太少 (B)資料混雜 (C)資料齊全 (D)電腦運算太慢。

( B ) 1. 下列何者不屬於資料分析技術?
(A)資料探勘 (B)資料處理 (C)機器學習 (D)深度學習。

( B ) 2. 下列何者不屬於機器學習演算法?
(A)迴歸分析 (B)二元樹 (C)最近鄰居法 (D)決策樹。

( A ) 4. 在平面座標上找出一條直線y=ax+b,來代表現有資料點的變化趨勢,這樣的作法稱為什麼?
(A)線性迴歸分析 (B)K-means (C)KNN  (D)決策樹。

( C ) 5. 機器學習領域的KNN演算法代表下列何者?
(A)迴歸分析 (B)K-平均法 (C)最近鄰居法 (D)決策樹。

( C ) 7. 下列何者不屬於「分類」演算法?
(A)最近鄰居法 (B)迴歸分析 (C)K-平均法 (D)決策樹。


( D ) 8. 依平均值分K群的方法,又稱為?
(A)K-最近鄰居法 (B)決策樹(C) 迴歸分析 (D)K-平均法。

( A ) 9. 所使用的資料不需要包含類型標籤,只以資料的某些特徵將資料區分為不同的群,這種機器學習模型屬於下列如種? 
(A)非監督式學習(B)半監督式學習 (C)監督式學習 (D)強化學習。

===============

3. (D)關於資料探勘(Data Mining)中線性迴歸(Linear Regression)的敘述,下列何者正確?
(A) 找出資料中的相似性
(B) 將資料分門別類並指派類別
(C) 找出資料中的異常值並給予修正
(D) 利用歷史資料對未知數值進行預測


21.(B)網路運作過程中,下列通訊協定何者在傳輸使用者資料前需先建立連線?
(A) IP(Internet Protocol)
(B) FTP(File Transfer Protocol)
(C) UDP(User Datagram Protocol)
(D) DHCP(Dynamic Host Configuration Protocol)

25. (B)假設您拿到 9000 筆 ( 資料點 ) 標示有信用卡消費金額的資料,您想要利用 K -平均法( K - means) 找出信用卡消費行為三個不同的族群,以利後續的資料分析。關於使用 K -平均法將這些資料分群的過程,下列敘述何者正確?
(A) K-平均法首先要從該資料中隨機選擇3000筆資料點作為初始群中心點
(B) K-平均法運算過程中將盡量減少每個分群內的所有資料點與其群中心點的距離總和
(C) K-平均法運算過程中將盡量增加每個分群內的所有資料點與其群中心點的距離總和
(D) K-平均法會計算該群中消費金額較高的前5%資料點之平均值,將其作為新的中心點


27. (D)使用二分搜尋法 ( Binary Search ) 對有序陣列 { 2 , 4 , 6 , 8 , 10 , 11 , 12 , 14 , 16 , 18 , 20 } 搜尋
目標元素 14,在第二次數值比較後,搜尋範圍變成下列何者?
(A) {16,18 } (B) { 18 , 20 } (C) { 14 , 16 } (D) { 12 , 14 }

29. (B)老師進行學生成績資料轉換至校園學生成績資料庫前,需完成下列資料處理步驟:更正
超過100或低於0的錯誤分數、刪除重複輸入的學科分數、修改拼字錯誤的學生姓名、移除
輸入不完整且有缺漏的資料,這些資料處理步驟又統稱為何?
(A) 資料壓縮(Data Compression) (B) 資料清洗(Data Cleaning)
(C) 資料加密(Data Encryption) (D) 資料排序(Data Sorting )

36. (C)關於決策樹(Decision Tree )的敘述,下列何者正確?
(A) 決策樹不屬於分類演算法,無法建立分類模型
(B) 決策樹十分複雜且不容易解釋和理解,實用性有限
(C) 決策樹能夠處理數值型和類別型資料,且資料必須事先標記(Labeling)
(D) 決策樹之分支判斷只有YES與NO兩種選項,因此無法處理複雜的問題


9. (D)關於監督式學習(Supervised Learning )與非監督式學習(Unsupervised Learning )的說明,
下列何者正確?
(A) 決策樹(Decision Tree )無法用於監督式學習中
(B) K-Means分群演算法不能用於非監督式學習中
(C) 在監督式學習中,被拿來訓練的資料不需要先進行標籤化處理
(D) 在非監督式學習中,被拿來訓練的資料不需要先進行標籤化處理

24. (B)子元在學校負責管理實驗室的電腦網路,實驗室目前有 10 台電腦都需要連上網路,擬採
動態方式配置IP,於是子元建置DHCP(Dynamic Host Configuration Protocol)伺服器,用以提
供實驗室的電腦自動取得IP設定,關於DHCP動態主機設定協定之敘述,下列何者正確?
(A) DHCP用戶端無須傳送IP請求訊息,DHCP伺服器會主動配發IP位址
(B) DHCP用戶端取得IP位址之後,仍需要定期向DHCP伺服器更新租約
(C) DHCP用戶端的租約到期之後,不可以再繼續要求使用同一個IP位址
(D) DHCP用戶端可以分配私有(Private )IP位址給內部子網路的所有電腦

25. (B)在《用數據看臺灣》的網站中,有一項為使用政府資料開放平台彙整的全臺各縣市即時
雨量資料,為了方便呈現臺灣不同區域的降雨量情況,小美將該資料中的縣市地點
簡化為北部、中部、南部、東部等4個區域,此項資料處理方法稱為?
(A) 資料清洗(Data Cleaning ) (B) 資料轉換(Data Transformation )
(C) 資料探勘(Data Mining) (D) 資料視覺化(Data Visualization )


37. (C)開放系統連結(Open System Interconnection,OSI)通訊協定當中的每一層,均有特定的處理
作業,並與其上下層進行通訊,關於OSI通訊協定七層架構中,各層處理資料之說明,下
列何者敘述正確?
(A) 資料連結層 ( Data Link Layer ) 在區段資料中加入 IP 位址形成封包 ( Package ) ,並選取傳輸的最佳路徑
(B) 網路層( Network Layer)會在封包資料中加入目的位址( MAC)形成資料框( Frame ),再加上錯誤檢查碼
(C) 傳輸層 ( Transport Layer ) 將訊息切割成區段 ( Segment ) ,該層會監控網路流量及處理資料遺失時重送
(D) 表達層(Presentation Layer)主要確認雙方的通訊模式,以及傳輸工作的偵錯、復原和結束連線方式等

 

[ 資訊科技 ] 瀏覽次數 : 158 更新日期 : 2024/05/20