Python数据统计脚本

代码说明:【python版本:2.7】
数据集输出txt文件格式:


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
#!/etc/bin/python
#coding:utf-8
#glob模块是用来查找匹配的文件的,在查找的条件中,需要用到Unix shell中的匹配规则:
import glob
#代码实现函数DataResult()
def DataResult():
#读取该目录下的所有txt文件
FileNameList = glob.glob("./*.txt")
#输入文件
Ouput_File= open('output/Result.txt','w')
#下面做测试代码
#print FileNameList
#f = open("vrpnc1_30000_1.txt")
#lines = f.readlines()
#print(type(lines))
#print(lines[-1])
#由于我们要统计十个txt文件的数据,因此用index变量来判断是否统计十个文件
index = 0
#Time和Costs为了统计时间和花销,为统计十个文件后,Time和Costs要重新赋值为0
Time = 0
Costs = 0
#注:tmp的设置要大于所有要统计的Costs的值
tmp = 100000
Ouput_File.write("\t\t" + "Good_Costs" + "\t\t" + "Average_Costs" +"\t\t" +"Average_Time"+"\n\n")
#读取FileNameList列表中的每个文件
for File in FileNameList:
#测试每个数据集结果十个文件是否连续出现
#print File[2:9]
#由于我们要统计十个txt文件的数据,因此用index变量来判断是否统计十个文件
index = index + 1
with open(File, 'r') as file:
#读取某个txt文件的全部内容
Lines_Content = file.readlines()
#下面做测试代码
#print(Lines_Content)
#print File[2:8]
#for line in Lines_Content:
#print line
#print(Lines_Content[-2])
#print(Lines_Content[-1])
#收集文件中的时间和花销
Cost = float(Lines_Content[-1])
Time = Time + float(Lines_Content[-2])
Costs = Costs + Cost
#统计Costs最小的值
if(Cost<tmp):
tmp=Cost
#遍历十个文件后做一次输出操作,并将Time、Costs设置为0.注:tmp的设置要大于所有要统计的Costs的值
if(index % 10 == 0):
Ouput_File.write(File[2:9] + ":"+str(tmp)+"\t"+str(Costs/10)+"\t\t"+str(Time/10.00)+"\n\n")
Time = 0
Costs = 0
tmp = 100000
#print type(Time)
#print type(Cost)

file.close()
def main():
DataResult()
if __name__ == "__main__":
main()

效果:

坚持原创技术分享,您的支持将鼓励我继续创作!