最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
當前位置: 首頁 - 科技 - 知識百科 - 正文

在Gnumeric下使用Python腳本操作表格的教程

來源:懂視網 責編:小采 時間:2020-11-27 14:39:40
文檔

在Gnumeric下使用Python腳本操作表格的教程

在Gnumeric下使用Python腳本操作表格的教程:關于Gnumeric Gnumeric是linux平臺下的一款功能強大且易于使用的電子表格軟件,與其他常用電子表格軟件如Excel等在風格上非常一致。Gnumeric當前的穩定版是1.2.13,對中文的支持已經比較成熟。據官方信息,Gnumeric除實現了MS Excel所有的函數外
推薦度:
導讀在Gnumeric下使用Python腳本操作表格的教程:關于Gnumeric Gnumeric是linux平臺下的一款功能強大且易于使用的電子表格軟件,與其他常用電子表格軟件如Excel等在風格上非常一致。Gnumeric當前的穩定版是1.2.13,對中文的支持已經比較成熟。據官方信息,Gnumeric除實現了MS Excel所有的函數外
關于Gnumeric

Gnumeric是linux平臺下的一款功能強大且易于使用的電子表格軟件,與其他常用電子表格軟件如Excel等在風格上非常一致。Gnumeric當前的穩定版是1.2.13,對中文的支持已經比較成熟。據官方信息,Gnumeric除實現了MS Excel所有的函數外,還實現了60多個Excel中不存在的函數和基本的金融方面函數,并已經具備了高級統計分析、可擴展的隨機數產生器、線性或非線性求解的計算能力。更令人驚喜的是,現在Gnumeric已經集成了Python強大的腳本編程能力,Python用戶可以為Gnumeric實現更為復雜的計算功能。

何謂Python

Python是一種解釋性的,面向對象的,具有動態語義的程序設計語言。Python代碼具有優秀的可讀性,具有模塊和包的概念,支持各種主流平臺,并具有很好的跨平臺能力。Python已廣泛用于文本處理、互聯網編程、數據庫編程、系統管理等領域 。同時Python又是一種成功的嵌入語言,包裝C/C++的代碼非常方便,越來越多的重量級應用程序開始支持Python腳本編程,OpenOffice, GIMP, Blender等。

插件初探

任何一個C函數調用或訪問一個Python對象都必須遵循這樣一個框架:

1. C函數把調用參數轉換成Python語言數據類型

2. 利用轉換后的參數調用Python函數

3. 返回值轉換成C語言類型,并返回給C函數

類似的,從Python函數調用C函數也遵循相似的步驟:

1. Python函數把參數轉換成C語言類型

2. 用轉換后的參數調用C函數

3. 返回值轉換成Python語言類型后返回給Python函數

因此Python函數和C函數相互調用的關鍵是數據的相互轉換問題,這些轉換需要相當好的C和Python解釋語言開發功底,好在Gnumeric的Python插件已經自動為我們做了數據類型的轉換,我們只需關注算法的實現就可以了。

Gnumeric和Python的交互也遵循類似的過程,首先Gnumeric自動轉換參數類型,繼而調用Python函數,最后再把返回值轉換成合適的類型返回給Gnumeric。下面是Gnumeric和Python的常見數據類型對應表:

2015414171408625.gif (518×193)

對于單元格(Cell),Gnumeric把單元格中的數據直接轉換相應的數據類型,傳遞被調用Python函數,如整數(Integer)、浮點數(Float)、字符串(String);然而對于單元格區域(Range),Gnumeric采取迂回的策略,只是傳遞一個單元格區域的引用(RangeRef)給被調用Python函數,而Python這時就需要通過Gnumeric接口才能訪問和操作單元格區域中的數據。因此,Gnumeric為Python提供了Gnumeric模塊,,包括Gnumeric的全部函數和工作薄工作表對象,這里簡略地列出了Gnumeric模塊中的函數和對象(具體細節請讀者參考Gnumeric的py-gnumeric.c源文件位于plugins/python-loader目錄)。

2015414171445159.gif (537×398)

范例分析

通過上面的介紹,我們初步了解了跨語言調用的框架,在此基礎上再來分析一下Gnumeric軟件包自帶的Python插件范例(通常位于/usr/lib/gnumeric//plugins/py-func/)。該范例由plugin.xml、py_func.py兩個文件構成,plugin.xml是XML形式的配置文件,供Gnumeric來讀取python函數的相關信息;py_func.py包含Python函數的定義和函數原型字典。

首先分析的是py_func.py文件。該文件定義了三個函數:func_printf,func_capwords,func_bitand,功能分別是格式化輸出,單詞首字母大寫,按位求和。我們來比較一下這三個函數:

2015414171543375.gif (515×103)

以func_bitand函數為例,函數接受兩個整數,返回值也為整數,C與Python的類型轉換是Gnumeric自動完成的,func_bitand只注重算法的實現,具體計算是通過調用Gnumeric的按位求和函數(bitand)完成的;值得一提的是''@''開頭的文檔字符串是提供給Gnumeric的文檔接口,分別提供函數的功能、接口、實例以及引用方面的信息,格式也是固定的,每個域(包括換行符)用單引號括起來并后接""。
代碼 1 func_bitand函數定義

from Gnumeric import *
def func_bitand(num1, num2):
 '@FUNCTION=PY_BITAND
'
 '@SYNTAX=PY_BITAND (num)
'
 '@DESCRIPTION=The BITAND function returns bitwise'
 'and-ing of its arguments.'
 '
'
 '@EXAMPLES=
'
 'PY_BITAND(6, 2) equals 2)'
 '
'
 '@SEEALSO=BITAND'
 
 
 gnm_bitand=functions['bitand'] # Gnumeric的按位求和函數
 return gnm_bitand(num1, num2)

py_func.py文件尾處還有一個起特殊作用的字典,向Gnumeric提供Python函數原型信息,姑且稱之為函數原型字典。函數原型字典的命名是非常嚴格的,必須以"_functions"為后綴,"_"前面前面的名字必須與plugin.xml文件保持一致,這樣Gnumeric才能發現插件中的各種函數信息,否則Gnumeric就會出現許多函數信息方面的錯誤,導致插件函數無法使用。函數原型用字典中"key:value"對來表示(代碼2), 如func_bitand,key就是在Gnumeric被映射的函數名py_bitand,value是由參數類型、參數名稱、函數名稱組成的元組。
代碼 2 test_functions函數原型字典

test_functions = {
 'py_printf': func_printf,
 'py_capwords': ('s', 'sentence', func_capwords),
 
 
 'py_bitand': ('ff', 'num1, num2', func_bitand)
}

在函數原型字典中,參數類型是用特殊的字符來表示的,例如func_bitand的兩個浮點數參數表示為"ff"。常見參數類型的字符串表示總結如下:

2015414171707629.gif (288×189)

另外一個結構簡單的XML文件plugins.xml (1) ,是開發者向Gnumeric提供的配置信息。information標簽中的name和description標簽提供了該插件的名字和描述信息,而且這些信息的國際化也很簡單,只需要在有語言標記的相應標簽中填寫國際化信息即可。loader標簽中attribute標簽的value屬性、service標簽中id屬性、function標簽中的name屬性是最重要的,分別對應于Python腳本文件名、腳本中的函數原型字典名(不包括后綴)、函數原型函數的key。對于本例,屬性值為py_func,test,py_printf,py_capwords,py_bitand,則對應于插件分別為py_func.py和test_functions,py_printf,py_capwords,py_bitand。這些對應關系一定要一致,否則Gnumeric就會向你抱怨了。
代碼 3 py-func.py的plugin.xml配置文件

<?xml version="1.0" encoding="UTF-8"?>

 
 Python functions
 Sample Python plugin providing
  some (useless) functions.
 
 
 
 
 
 
 
 
  Python
  
  Python
  
  
  
  
  
  
 
 


牛刀小試

根據上面的分析,我們看到用Python編寫Gnumeric函數,需要三個步驟:

1. 創建Python函數源文件,如py_func.py。

2. 根據創建的函數構建函數原型字典,如test_functions。

3. 創建plugin.xml配置文件,配置文件名、函數分類、名字、原型字典等相關信息。

為了演示具體的Gnumeric中Python函數創建的過程,筆者編寫了一個根據自動標記成績等級的小函數,由plugin.xml和exam.py兩個文件構成。

首先創建腳本文件exam.py,整個文件只有mark和cstr兩個函數:mark函數的參數和返回值都是字符串,功能是根據其大小返回成績的等級;cstr用來把字符串轉換成utf-8編碼,使Gnumeric能顯示中文 (2) 。mark函數中的注釋是提供給Gnumeric的函數信息,讀者開發時只需要按著模板簡單的修改就可以了。
代碼 4 exam.py文件

# -*- coding: GB2312 -*-
def mark(score):
 '@FUNCTION=MARK_SCORE
'
 '@SYNTAX=mark_score(score)
'
 '@DESCRIPTION= determine the level for a score
'
 '@EXAMPLES= To determine a score in A1: 
'
 ' mark_score(a1)
'
 '@SEEALSO='
 level='N/A'
 if score < 0:
 level = cstr('非法分數')
 elif score < 60:
 level = cstr('未及格')
 elif score < 80:
 level = cstr('及格')
 elif score < 90:
 level = cstr('良')
 elif score <= 100:
 level = cstr('優秀')
 else:
 level = cstr('非法分數')
 return level
def cstr(str):
 """ translate a chinese string into utf-8 string for GTK+ 
 """
 return unicode(str,'gbk').encode('utf8')
exam_functions = {
 'mark_score' : ('f','score',mark)
}

下一步就是就是注冊函數,exam.py文件尾處的exam_functions函數原型字典向Gnumeric揭示了mark函數的原型信息,字典的鍵'mark_score'是mark在Gnumeric的名字映射,f表示參數類型為整數,score為參數名。plugin.xml (3) 是根據模板簡單的改寫的,主要注意的就是上面提到的幾個屬性,必須和插件對應,否則插件是無效的;另外一些屬性,如category也加入了中文信息,以方便使用。
代碼 5 exam.py的plugin.xml配置文件

<?xml version="1.0" encoding="UTF-8"?>

 
 Exam functions
  Determine rank for exam score 
 
 
 
 
 
 
 
 
 
 Exam
 Exam
 
 
 
 
 


OK!現在啟動Gnumeric (4) ,按圖示在A列輸入一列成績,然后在B1單元格內輸入公式:'=mark_score(A1)', 然后利用鼠標拖動復制公式的功能,把公式復制到對應的B列,就會發現所有標志在B列中已經自動生成了。
插圖1 成績分類

2015414171815436.png (585×458)

更進一步

如果只是對單元格數據簡單計算的話,那么Python在Gnumeric中充其量是好玩的玩具罷了,但Python插件的功能遠不只這些,Python可以控制讀寫單元格區域(Range)的數據,訪問Gnumeric的全部函數,控制工作表的創建等,把這些功能有機地組合起來就能完成復雜的任務了。本節對全班成績做進一步的處理,利用RPy (5) 的summary函數對所有的分數進行簡單的統計,計算最值、均值、中位數和兩個四分位數,并把所得計算結果打印到新的工作表中。

要想統計全班成績,首要的任務就是從Gnumeric獲取數據。對于大批量的數據,Gnumeric是用單元格區域(Range)來表示的,然而在調用過程中傳遞給Python的是單元格區域引用(RangeRef),所以需要對單元格區域引用(RangeRef)做相應的轉換以便提取批量數據。不幸的是,Gnumeric的API正處于發展階段,沒有直接的轉換方法。為此,筆者利用了Gnumeric自身的函數構建了一個PyGnmRange類。PyGnmRange對象以單元格區域引用(RangeRef)為初始化參數,為該單元格區域中的構建所有單元格的索引,即"_table"屬性,同時提供幾個方法來方便地訪問,這樣我們就可以配合Gnumeric模塊中的Sheet對象操縱單元格數據了。
代碼 6 類PyGnmRange的定義

 class PyGnmRange:
 def __init__(self, gnm_range_ref):
 get_cols = Gnumeric.functions['column']
 get_rows = Gnumeric.functions['row']
 get_col_num = Gnumeric.functions['columns']
 get_row_num = Gnumeric.functions['rows']
 cols = get_cols(gnm_range_ref)
 rows = get_rows(gnm_range_ref)
 # column first table
 self._table = []
 self._col_num = get_col_num(gnm_range_ref)
 self._row_num = get_row_num(gnm_range_ref)
 for i in range(self._col_num):
 for j in range(self._row_num):
 self._table.append((cols[i][j]-1, rows[i][j]-1))
 def col_num(self):
 return self._col_num
 def row_num(self):
 return self._row_num
 def get_col(self,col):
 start = (col-1) * self._row_num
 end = col * self._row_num
 return self._table[start:end]
 def get_row(self,row):
 indexes = [(i*self._row_num)+(row-1) for i in range(self._col_num)]
 return [self._table[i] for i in indexes]
 def __iter__(self):
 return iter(self._table)

另外PyGnmRange類定義需要注意兩點:

1. 單元格下標采取了列優先的表示方法,從零開始計數,例如B3表示為(1,2),這樣同時也是為了與Gnumeric規范保持一致,便于操縱單元格數據。

2. 類初始化函數使用了四個Gnumeric的函數,分別為column、columns、row、rows,其功能如下:

2015414171941058.gif (556×198)

有了前面的準備,我們就可以具體實現summary函數了。summary函數通過gnm_scores參數獲得當前的單元格區域引用,并利用該參數創建PyGnmRange對象,計算所有單元格的下標;又通過Gnumeric模塊的workbooks和sheets函數,取得工作表1的對象;從而結合工作表對象和單元格下標來操作單元格數據。而真正的計算R語言完成的,RPy模塊則是聯接Python和R語言的橋梁 (6) 。最后,summary函數取得R語言計算的結果并通過Gnumeric模塊將其打印到一個新建的工作表里。
代碼 7 exam.py 中summary函數定義

<?xml version="1.0" encoding="UTF-8"?>

 
 Exam functions
 Sample Python plugin providing some (useless) functions.
 
 
 
 
 
 
 
 Exam
 Exam
 
 
 
 
 
 


函數編寫完之后就是函數注冊了,函數原型字典只有一行,唯一需要注意的是,單元格區域引用數據類型需要用"r"來表示。plugin.xml文件也只需要加入下面一行:
代碼 8 summay函數的plugin.xml配置文件

<?xml version="1.0" encoding="UTF-8"?>

 
 Exam functions
 Sample Python plugin providing some (useless) functions.
 
 
 
 
 
 
 
 Exam
 Exam
 
 
 
 
 
 


下面的兩張是插件函數的運行效果圖,輸入數據是隨機生成的80個100以內的浮點數,函數插在B1單元格內,由于該函數的目的是生成簡單的報表而不是返回值,所以運行結束后B1單元格內依然空白,而所有的數據全部打印在新建的工作表4內(圖2和圖3)。
插圖2 全班成績和函數的輸入

2015414172056240.png (564×378)
插圖3 全班成績統計報告

2015414172122545.png (564×378)

插件部署

Gnumeric插件部署及其簡單,用戶只需要在自己主目錄下新建.gnumeric目錄,放入插件函數即可,例如exam.py和plugin.xml就是位于 /.gnumeric/ (7) /plugins/exam/,重新啟動Gnumeric插件就生效了 (8) 。

結束語

Gnumeric的Python開發過程需要注意一下幾個問題:

1. Gumeric的Python插件還處于積極地開發過程中,一些代碼很可能在將來的版本中會發生很大的變化;插件提供的Gnumeric模塊接口還不是完整,比如缺乏獲得活動工作表的函數,編寫Python函數時需要仔細地處理。

2. Python函數配置雖然及其簡單,但是調試起來不是很方便,經常會出現Gnumeric不能正確獲取Python信息的情況,這時候的原因是多方面的,例如plugin.xml文件的名字與腳本文件不一致,函數原型字典命名不規范,函數文檔字符串格式錯誤,腳本文件語法錯誤等。

盡管這樣,對于熟悉Python的編程人員來說,這些并不影響編寫Gnumeric函數的趣味,只需小心仔細地處理,這些都不是很難的事。希望本文能起到拋磚引玉的作用,有興趣的讀者可以在此基礎上參考Gnumeric源代碼中的開發者文檔和Python插件的源代碼,會發現許多有價值的信息,編寫更有價值的應用了。

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

在Gnumeric下使用Python腳本操作表格的教程

在Gnumeric下使用Python腳本操作表格的教程:關于Gnumeric Gnumeric是linux平臺下的一款功能強大且易于使用的電子表格軟件,與其他常用電子表格軟件如Excel等在風格上非常一致。Gnumeric當前的穩定版是1.2.13,對中文的支持已經比較成熟。據官方信息,Gnumeric除實現了MS Excel所有的函數外
推薦度:
標簽: 教程 工作表 python
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

專題
Top
国产精品久久久久精品…-国产精品可乐视频最新-亚洲欧美重口味在线-欧美va免费在线观看