[转itpub帖子]大表建索引
上亿条的数据量(不是分区表)如何快速建立索引
数据库10.2.0
os:linux
db运行为noarchivelog
表中数量级为亿以上,普通表,未做分区
如何在表上快速的建立复合索引
我使用如下语句建立复合索引
create index indexname on table(column1,column2) tablespace indx;
该语句运行了n久了,还没运行完,
我想应该是create index需要排序,而表中的数据量太大,可能排序需要在硬盘上才能完成,如果要避免这种情况,快速建立索引,应该怎么做啊?
请大家帮忙给点意见,谢谢。
总结一下:
1。 使用并行参数,8个CPU, 可以用parallel 6 ,最多占用6个CPU, 正常情况下没问题(前提是其他应用没有占超过2个CPU的资源)
2。 nologging, 绝对应该使用,会使速度大幅上升。(减少大量redo log)
3。 PGA, 普通的auto pga最大才100M, 显然没有达到最好性能,应该使用manual pga
alter session set workarea_size_policy=manual;
alter session set hash_area_size=100000; -- hash_area_size 默认情况下会自动根据sort_area_size*2来调,导致sort_area_size不能超过1G, 手动设了就没问题了。
alter session set sort_area_size=2000000000; -- 在系统可用内存足够的情况下,最大可以到2G
4。 设置高一点的db_file_multiblock_read_count 也有利于提高I/O性能。保证足够大的db_cache_size可以避免free_buffer_wait的出现
5。 可以通过v$session_longops 来监视进度
sort_area_size设2g会不会太大了,加上parallel 6的话可能会消耗2*6=12g内存,LZ的物理内存是8g
呵呵,对于LZ来说还真可能太大。
我说的是普遍状况,在系统可用内存足够的情况下,sort_area_size可以达到2G
