數據
文章平均质量分 58
Learn-Share_HY
这个作者很懒,什么都没留下…
展开
-
[Excel]如何限制儲存格輸入格式? 以“字首為英文字母大寫,其餘為數字,共15碼“為範例
當一個excel表格需要由多位使用者來輸入資料時,難免會出現資料輸入錯誤問題,尤其是料號,品號或是訂單號的長類型編碼。若是問題屬於輸入錯誤"資料"但格式未錯誤,則可能需要讓excel做編碼遞增或遞減等等參照編碼原則的方式來檢核,這得視編碼原則內容而定;若是問題屬於輸入錯誤"格式",則可利用excel中資料驗證功能的自訂函式來設定,同時自訂函式可依需求設定輸入格式提示描述和錯誤格式提示描述。本文處理的是輸入錯誤"格式"問題。原创 2024-04-13 08:46:39 · 434 阅读 · 0 评论 -
[MySQL]同一張資料表的日期欄位相減_派生表(dervied table)的應用
以往對於MySQL數據庫的應用,大多是基本的增刪改查步驟,因此MySQL大多停留在基本語法階段。然而在實際的數據應用上,若能從數據庫直接運算和抽取運算結果,同時不需要在MySQL中額外建立一個實體表,再好不過。在MySQL中,虛擬表可符合上述需求,其中虛擬表包含臨時表(temporary table)、派生表(derived table)等等。臨時表的語法需注意嵌入以CREAT TEMPORARY TABLE...為開頭...原创 2023-03-27 21:05:42 · 730 阅读 · 0 评论 -
[Excel]如何取得多項式擬合的R平方值(R-squared)?
延續<[Excel]如何取得趨勢線的參數值>一文,有網友提問,如何進一步提取多項式擬合的R平方值(R-squared),並期望隨著參數調整而即時動態取得。經查詢LINEST的語法說明,藉由陣列形式和設定stats為True,可提取動態R平方值(R-squared)。LINEST(known_y's,known_x's,const,stats)以上圖範例,對應陣列公式如下,即可提取動態R平方值(R-squared),如黃色填滿處。LINEST($E$3:$E$7..原创 2022-03-06 11:53:32 · 6170 阅读 · 0 评论 -
[Excel]如何取得趨勢線的參數值
為了讓同事在提供規格或是工程量測試算可以更加快速且正確,現在提供給他們的試算表基本上都是以函數置入,讓他們只要做簡單的數字輸入,即可得到想要的試算結果。關於一些客戶提出的推估要求,常常會需要以現有數值結合擬合(fitting)來估算結果,有時更要拿擬合得到的參數做進一步的分析。當面臨到龐大的數據量,複製貼上就顯得特別礙手又容易造成錯誤。上述Excel的例子,是用一組x,y數字做簡單的線性擬合,其中藉由 slope和intercept的函數指令可以得到趨勢線擬合參數數值,如黃色表格的a和b值...原创 2022-03-06 11:19:50 · 2476 阅读 · 0 评论 -
[Python]如何將批量的PDF資料匯總為Excel清單?
在Python中,常用於處理PDF的安裝包有兩個,pdfminer3k和pdfplumber,差異簡易描述如下:pdfminer3k:原创 2021-06-14 09:50:44 · 465 阅读 · 6 评论 -
[Python]初探爬蟲(scrapy)
隨著互聯網時代的到來,網路已成為人類生活的資料庫,只要輸入合適的關鍵字,大部分的問題可藉由搜索找到方向。然而,以另一個角度觀察,龐大的網路資料庫也易因為巨量的資料,導致容易失焦,因此如何從資料庫篩選出期望的主題資料是一個重點工作。早有耳聞Python的爬蟲功能,藉著零碎時間看了一些視頻,同時將重點摘要如下,供日後查閱,也供各位參考。1.和R語言類似,Python亦有許多安裝包供引入,其中關於爬蟲的安裝包為requests。其中需特別提醒的是有時候光引入requests尚無法將網頁HTML源碼完整擷取下來原创 2021-04-04 12:27:56 · 184 阅读 · 0 评论 -
[R]如何繪製條型圖(Bar chart)? geom_bar()
在數據分析中,直方圖(Histogram)和條型圖(Bar chart)是常用於觀察數據樣態的工具。關於直方圖的用法,可參考<[R]直方圖(Histogram)的用法>文章。關於條型圖的用法,各位一定不陌生,尤其是經過2020年的COVID-19疫情事件,為了統計和比較各區域的確診或死亡病例,各媒體常以條型圖呈現數據。在R語言中,藉由安裝包ggplot2亦可輕鬆繪製,範例程式如下。a.首先,利用install.packages()安裝ggplot2,並用library()導入。..原创 2021-02-16 12:05:59 · 439 阅读 · 0 评论 -
[R]如何篩選出特定子集數據? subset()
在R語言中,篩選出特定子集數據的函數為subset(),經由查詢Help的結果,其對應的描述和用法如下。顧名思義,利用邏輯符號表述篩選子集的方式,將符合條件的數據子集合篩選出來。subset():Subsetting Vectors, Matrices and Data FramesDescription:Return subsets of vectors, matrices or data frames which meet conditions.Usage:subset(x,logical expr原创 2021-02-11 16:37:40 · 2747 阅读 · 2 评论 -
[R]如何取得非重複的向量或數組? unique()
在數據處理中,去除並取得非重複的數組是一項基本需求。在R語言中,可以用unique函數實現。簡易範例如下:x <- c(8-1:5, 4:8, 6+0:5)y <- unique(x)#輸出結果> x [1] 7 6 5 4 3 4 5 6 7 8 6 7 8 9 10 11> y[1] 7 6 5 4 3 8 9 10 11在實際數據操作中,例如一個汽車出廠年份和油耗效率的數據集,為了解該數據集統計的年份跨度,亦原创 2021-02-07 23:39:14 · 553 阅读 · 0 评论 -
[R]如何擷取特定字串? substr()
在R語言中,擷取特定字串的函數為sunstr(),經由查詢Help的結果,其對應的描述和用法如下,顧名思義,substr()的用法僅需要定義原字串x,並定義起始字元和終止字元,即可達成效果。。sunstr():Substrings of a Character VectorDescription:Extract or replace substrings in a character vector.Usage:substr(x, start, stop)簡易範例如下,若終止字元大於原字串長度,.原创 2021-02-11 15:53:21 · 7030 阅读 · 0 评论 -
[R]直方圖(Histogram)的用法
直方圖(Histogram)常用於數據分布和分類的呈現功能。在R語言中,利用hist指令即可繪製,同時亦可輸出數據分布結果,語法說明如下。HistogramsDescription:The generic function hist computes a histogram of the given data values.hist(x, breaks = "Sturges", main = paste("Histogram of" , xname), xlim = rang...原创 2020-10-05 17:39:05 · 2710 阅读 · 0 评论 -
[R]如何根據特定字元拆分數據(str_split_fixed)?
關於數據集(dataset)的處理,往往讀入數據集後,需要進一步對於數據進行拆分或合併處理,以利銜接後續數據分析工作。在R語言中,可利用安裝包 stringr中的str_split_fixed指令,根據特定字元拆分批量數據,達到數據匯總之效果。本文利用經典的MovieLens數據集做為範例,其中該數據集包含movies.dat、ratings.dat和users.dat,我們以ratings.dat檔案做為拆分的範例說明。a.首先,用read.table將ratings.dat讀入檔案,檔案數據排列原创 2020-10-05 12:44:11 · 1203 阅读 · 0 评论 -
[R]如何查詢安裝包(package)中的數據集(dataset)?
安裝包(package)之於R,就如同一棵樹的主幹之於枝幹。藉由安裝包的拓展,R語言的功能得已趨近於完整。安裝包除了集成眾多函數之外,有時為了展示安裝包中的函數效果,會再自帶數據集。如應用於處理數據繪圖的lattice安裝包,就包含不少數據集。然而,我們如何知道下載的安裝包裡有哪些數據集可以使用呢?a.查詢所有已下載安裝包的數據集,指令和結果如下。data()...原创 2020-04-05 19:34:28 · 788 阅读 · 0 评论 -
汉斯·罗斯林(Hans Rosling)告訴你,如何將數據轉變決策?
TED演讲集:资本主义的困局 第25集 汉斯·罗斯林:近十年来的好消息?漢斯·羅斯林 (Hans Rosling),是卡洛琳學院的國際衛生學教授,曾經擔任世界衛生組織、聯合國兒童基金會和其他援助機構的顧問,因此對於一些國際公共衛生的議題相當重視,如糧食、健康和貧窮等等議題。還記得第一次接觸到漢斯的演講是在2009年的TED頻道,他的視頻演講不但具備邏輯性和知識性,同時還相當幽默風趣,相...原创 2020-02-22 11:52:42 · 513 阅读 · 0 评论 -
[Excel Vba]如何提取word內容,並將內容置入excel儲存格中?
Word和Excel 均屬於Microsoft office系列軟體,但兩個軟體的定位不一樣,Word屬於文字撰寫軟體,而Excel屬於數據試算軟體,然而有些資料若能同時運用兩個軟體的長處,事務運作起來將會事半功倍,因此整合使用兩個軟體有其重要性。例如將人力資源表格彙整成excel表格,並進一步善用excel篩選功能以輔助組織人力盤點工作。關於上述範例,摘要如下:a.引用物件"...原创 2019-08-25 20:45:41 · 1369 阅读 · 0 评论 -
[Tableau]如何製作數據地圖?
資料視覺化已是顯學,具備資料呈現的能力將是職場辦公室人員的基本門檻,一般可藉由產業知識並搭配資料的不同呈現面貌,使得資料有機會轉換成資訊,並進一步轉化成有利可圖的商業決策。Tableau是一套專門作資料分析暨視覺化工具的軟體,其中免費版本Tableau Public算是Tableau Desktop的精簡版,面向用戶為一般的消費者,利用Tableau可製作不少資料視覺化的面貌,例如一般商業智慧...原创 2019-01-02 13:58:42 · 662 阅读 · 0 评论