2025年9月2日 星期二

2025 09 02 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象, 一般可 利用哪種 統計工具 來描述資料分佈? (A) Zipf(齊夫分佈) (B) Gaussian(高斯分佈) (C) Dirichlet(狄利克雷分佈) (D) Uniform(均勻分佈)

 

2025 09 02 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象, 一般可 利用哪種 統計工具 來描述資料分佈? (A) Zipf(齊夫分佈) (B) Gaussian(高斯分佈) (C) Dirichlet(狄利克雷分佈) (D) Uniform(均勻分佈)

 AI應用規劃師初級: L11 人工智慧基礎概論 

     L11201 資料基本概念與來源


 50.  當使用  線性模型 時,哪種方法   對於    學習預測線性    不可分的  資料集

           也許 有幫助? 

        (A) 交叉驗證(Cross validation) 

        (B) 核方法(Kernel method) 

        (C) 過採樣(Over sampling) 

        (D) 降採樣(Down sampling)


51. 將網頁資料擷取下來之後,應先進行下列何步驟? 

        (A) 資料清理(Cleaning) 

        (B) 資料建模(Modeling) 

        (C) 資料變形(Reshaping) 

        (D) 趨勢預測(Prediction) 


 52. 假設Facebook公司給您1000位用戶的基本資料及文章資料,

           如: 姓名、性別、年齡以及最近十篇發文的時間、點讚數、回應數與

          分享 該文章所有人的基本資料,最適合 R語言中 的何種資料結構? 

       (A) 資料框架(Data frame) 

       (B) 串列(List) 

       (C) 向量(Vector) 

        (D) 矩陣(Matrix) 


 53. 若資料表中  只出現了一個   遺缺值(NA)值,下列何項處理方式最不 適當

        (A) 刪除整欄(變數) 

        (B) 刪除整列(觀測值) 

        (C) 以該欄其餘的資料平均值取代NA值 

        (D) 往回追溯資料源頭,尋找NA的來源 


 54. 下列何者  不是  資料倉儲  的資料類型? 

         (A) 運算資料 

         (B) 預先加總資料 

         (C) 中繼資料(Metadata)

          (D) 即時更新資料 


55. 一般來說,下列何者不是   資料清理的目的? 

           (A) 將資料轉為可以分析的格式 

           (B) 發現資料之間的相關性 

          (C) 處理遺缺值 

           (D) 讓計算及分析上,更為方便及降低偏誤 


56. 在一次考試中,由於班上同學考試成績最高分僅有70 分,為了能 夠

           讓學期成績比較好看,老師決定幫每個人的考試成績都加10分,

          請 問這個數值樣本中的  哪個統計量  不會因為調分  而有差別? 

           (A) 平均值 

           (B) 標準差 

           (C) 中位數 

            (D) 第一四分位數 


 57. 在統計學中,下列哪一個選項的  分佈類型  與其他不相同? 

           (A) 二項分佈(Binomial Distribution) 

           (B) 指數分佈(Exponential Distribution) 

           (C) t 分佈(t Distribution) 

           (D) 常態分佈(Normal Distribution) 


 58. 關於資料探索,下列敘述何者不正確? 

           (A) 透過工具函數(例如:R 語言當中的 summary 函數)可了解關於 

                  資料集內容的整體結構、變數情況、分佈指標、遺缺值 

           (B) 視覺化工具可幫忙了解變數間的關係,以利後續資料探勘作業 

           (C) 定性變數可計算出最小值、分位數、中位數、平均值與最大值進行 

                  觀察 

           (D) 透過平均值和中位數的差異程度來判斷資料的偏倚程度,可用來

                  判 斷資料之左偏或右偏情況 


59. 巨量資料中,以資料類別出現頻率排列下出現的長尾現象

          一般可 利用哪種  統計工具   來描述資料分佈? 

          (A) Zipf(齊夫分佈) 

          (B) Gaussian(高斯分佈) 

          (C) Dirichlet(狄利克雷分佈) 

          (D) Uniform(均勻分佈)



沒有留言:

張貼留言