本技術(shù)涉及建筑工程管理領(lǐng)域,特別涉及一種基于bim的建筑工程可視化管理方法及系統(tǒng)。
背景技術(shù):
1、隨著建筑工程的日益復(fù)雜化和信息化,building?information?modeling?(bim)技術(shù)在建筑領(lǐng)域得到了廣泛應(yīng)用。bim模型能夠集成建筑工程的幾何信息、屬性信息和關(guān)聯(lián)信息,為建筑工程的設(shè)計(jì)、施工和管理提供了數(shù)字化的平臺(tái)和工具。然而,建筑工程bim模型通常包含大量的高維、異構(gòu)的數(shù)據(jù),如何有效地組織、分析和利用這些數(shù)據(jù),是實(shí)現(xiàn)建筑工程可視化管理的關(guān)鍵。
2、目前,針對(duì)建筑工程bim數(shù)據(jù)的分析和管理,已有一些研究和應(yīng)用。其中,數(shù)據(jù)聚類是一種重要的數(shù)據(jù)分析技術(shù),通過將相似的數(shù)據(jù)點(diǎn)歸入同一類別,可以發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和關(guān)聯(lián)。傳統(tǒng)的聚類算法,如k-means和層次聚類,在處理高維數(shù)據(jù)時(shí)存在一些局限性,如聚類結(jié)果對(duì)初始值敏感、難以發(fā)現(xiàn)非凸形狀的聚類等。為了克服這些局限性,基于密度的聚類算法,如dbscan(density-based?spatial?clustering?of?applications?with?noise),被廣泛應(yīng)用于高維數(shù)據(jù)聚類。dbscan算法通過識(shí)別數(shù)據(jù)點(diǎn)的局部密度,可以發(fā)現(xiàn)任意形狀的聚類,對(duì)噪聲數(shù)據(jù)具有魯棒性。然而,現(xiàn)有的基于dbscan的bim數(shù)據(jù)聚類方法仍然存在一些不足。首先,建筑工程bim模型包含多個(gè)層級(jí)的數(shù)據(jù),如建筑、樓層、構(gòu)件等,現(xiàn)有方法通常將所有數(shù)據(jù)點(diǎn)視為同一層級(jí),忽略了數(shù)據(jù)的層級(jí)關(guān)系,導(dǎo)致聚類精度不高。其次,bim模型中的數(shù)據(jù)屬性具有不同的重要性,現(xiàn)有方法未能充分考慮屬性的權(quán)重差異,影響了聚類的質(zhì)量。此外,由于bim數(shù)據(jù)的高維性和復(fù)雜性,聚類結(jié)果的解釋和應(yīng)用也面臨挑戰(zhàn)。
3、例如相關(guān)專利文獻(xiàn)cn117787670b,公開了一種基于建筑工程的bim數(shù)據(jù)管理方法及系統(tǒng),屬于數(shù)據(jù)管理領(lǐng)域,其中方法包括:對(duì)目標(biāo)建筑工程內(nèi)的多個(gè)數(shù)據(jù)源進(jìn)行數(shù)據(jù)點(diǎn)采集,生成建筑工程數(shù)據(jù)集;對(duì)目標(biāo)建筑工程的歷史建筑工程數(shù)據(jù)進(jìn)行聚類分析,生成多個(gè)建筑工程數(shù)據(jù)類;生成數(shù)據(jù)協(xié)同陣列,進(jìn)行降維處理,獲得降維數(shù)據(jù)陣列,遍歷目標(biāo)建筑工程的bim數(shù)據(jù)與降維數(shù)據(jù)陣列進(jìn)行匹配,獲取數(shù)據(jù)匹配點(diǎn)集,進(jìn)行bim數(shù)據(jù)的分析管理,生成管理策略;通過管理策略對(duì)目標(biāo)建筑工程進(jìn)行bim數(shù)據(jù)的管理。但是該方案該方案僅對(duì)建筑工程的歷史數(shù)據(jù)進(jìn)行聚類分析,未能充分利用bim模型中的幾何信息、屬性信息和關(guān)聯(lián)信息,忽略了建筑工程數(shù)據(jù)的多層級(jí)特性。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中基于bim的建筑工程高維數(shù)據(jù)聚類精度低,本技術(shù)提供了一種基于bim的建筑工程可視化管理方法及系統(tǒng),通過改進(jìn)dbscan聚類算法,并根據(jù)建筑工程bim模型的層級(jí)關(guān)系進(jìn)行聚類分析等,提高了分析精度。
2、本技術(shù)的目的通過以下技術(shù)方案實(shí)現(xiàn)。
3、本技術(shù)的一個(gè)方面提供一種基于bim的建筑工程可視化管理方法,包括:s1,采集建筑工程數(shù)據(jù),生成包含幾何信息、屬性信息和關(guān)聯(lián)信息的數(shù)據(jù)集;s2,根據(jù)建筑工程bim模型的層級(jí)關(guān)系,將數(shù)據(jù)集劃分為多個(gè)層級(jí)子集;采用改進(jìn)的dbscan聚類算法對(duì)每個(gè)層級(jí)子集進(jìn)行聚類分析;所述改進(jìn)的dbscan聚類算法通過引入屬性權(quán)重機(jī)制,根據(jù)屬性的重要性調(diào)整聚類過程中的距離度量;s3,合并不同層級(jí)子集的聚類結(jié)果,得到數(shù)據(jù)集的多個(gè)數(shù)據(jù)聚類;s4,根據(jù)數(shù)據(jù)聚類對(duì)數(shù)據(jù)集進(jìn)行分類歸檔,根據(jù)分類歸檔結(jié)果生成語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a;s5,對(duì)語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a進(jìn)行降維處理,得到降維數(shù)據(jù)陣列;s6,采用基于密度的空間索引方法構(gòu)建降維數(shù)據(jù)陣列的空間索引;利用分布式計(jì)算框架,將建筑工程bim模型劃分為多個(gè)分區(qū),將分區(qū)與空間索引進(jìn)行分布式匹配,得到數(shù)據(jù)匹配點(diǎn)集;s7,根據(jù)數(shù)據(jù)匹配點(diǎn)集進(jìn)行可視化分析,生成管理策略。
4、進(jìn)一步的,s2,采用改進(jìn)的dbscan聚類算法對(duì)每個(gè)層級(jí)子集進(jìn)行聚類分析,包括:s21,根據(jù)建筑工程bim模型的層級(jí)關(guān)系,將數(shù)據(jù)集劃分為多個(gè)層級(jí)子集;所述層級(jí)關(guān)系包含建筑、樓層和構(gòu)件;s22,設(shè)置動(dòng)態(tài)權(quán)重矩陣w,初始化權(quán)重值,定義局部數(shù)據(jù)特征度量,局部數(shù)據(jù)特征度量用于衡量第k個(gè)屬性在第t次迭代中的局部重要性;s23,在每次迭代中,根據(jù)局部數(shù)據(jù)特征度量和上一次迭代的聚類結(jié)果,更新動(dòng)態(tài)權(quán)重矩陣w;s24,計(jì)算任意兩個(gè)數(shù)據(jù)點(diǎn)和之間的加權(quán)歐氏距離;s25,根據(jù)加權(quán)歐氏距離,對(duì)每個(gè)層級(jí)子集進(jìn)行dbscan聚類,得到相應(yīng)層級(jí)的數(shù)據(jù)聚類結(jié)果;s26,重復(fù)步驟s23至步驟s25,直至聚類結(jié)果收斂或達(dá)到預(yù)設(shè)的最大迭代次數(shù),得到每個(gè)層級(jí)的最終聚類結(jié)果。
5、一方面,傳統(tǒng)的dbscan算法使用單一的距離度量(如歐氏距離)來衡量數(shù)據(jù)點(diǎn)之間的相似性,將所有數(shù)據(jù)點(diǎn)視為平等的個(gè)體。這種處理方式忽略了建筑工程bim數(shù)據(jù)中固有的層級(jí)結(jié)構(gòu),如建筑、樓層、構(gòu)件等不同層級(jí)之間的關(guān)系。單一距離度量無法捕捉和表示不同層級(jí)數(shù)據(jù)之間的語義差異和關(guān)聯(lián)性,導(dǎo)致聚類結(jié)果無法準(zhǔn)確反映建筑工程的實(shí)際結(jié)構(gòu)。
6、本技術(shù),根據(jù)建筑工程bim模型的層級(jí)關(guān)系,將數(shù)據(jù)集劃分為多個(gè)層級(jí)子集,如建筑、樓層和構(gòu)件等。這種層級(jí)劃分考慮了bim數(shù)據(jù)的多層級(jí)特性,使得聚類算法能夠更好地適應(yīng)建筑工程數(shù)據(jù)的結(jié)構(gòu)和組織方式。通過對(duì)不同層級(jí)數(shù)據(jù)的獨(dú)立聚類分析,可以發(fā)現(xiàn)各層級(jí)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)和模式,提高聚類的精度和可解釋性。
7、本技術(shù),在計(jì)算數(shù)據(jù)點(diǎn)之間的相似性時(shí),采用加權(quán)歐氏距離,將動(dòng)態(tài)權(quán)重矩陣與屬性差異相結(jié)合。通過引入屬性權(quán)重,使得聚類算法在計(jì)算距離時(shí)能夠重點(diǎn)考慮重要屬性的差異,減少次要屬性的干擾。
8、進(jìn)一步的,計(jì)算任意兩個(gè)數(shù)據(jù)點(diǎn)和之間的加權(quán)歐氏距離,通過如下公式:,其中,表示第t次迭代的加權(quán)距離;表示第k個(gè)屬性在第t次迭代中的動(dòng)態(tài)權(quán)重;和分別表示數(shù)據(jù)點(diǎn)和在第k個(gè)屬性上的取值;k為屬性的維度,取值范圍為1到n,其中n為數(shù)據(jù)集的屬性總數(shù);t表示聚類迭代的次數(shù),取值范圍為1到t,其中t為預(yù)設(shè)的最大迭代次數(shù)或聚類收斂時(shí)的迭代次數(shù);表示第k個(gè)屬性在第t次迭代中的局部重要性度量,可通過計(jì)算屬性在局部領(lǐng)域內(nèi)的方差、熵等指標(biāo)來衡量;,其中,α為學(xué)習(xí)率參數(shù),用于控制動(dòng)態(tài)權(quán)重的調(diào)整速度,取值范圍為0到1。
9、,其中,表示第k個(gè)屬性在數(shù)據(jù)點(diǎn)的局部領(lǐng)域內(nèi)第j個(gè)取值的出現(xiàn)概率;m表示第k個(gè)屬性在數(shù)據(jù)點(diǎn)的局部領(lǐng)域內(nèi)不同取值的個(gè)數(shù)。
10、傳統(tǒng)的dbscan算法在處理建筑工程bim數(shù)據(jù)時(shí),通常采用靜態(tài)的權(quán)重分配方式,即為每個(gè)屬性分配固定的權(quán)重值。然而,這種靜態(tài)權(quán)重分配可能無法適應(yīng)建筑工程數(shù)據(jù)在不同層級(jí)和區(qū)域的局部特征和變化。不同屬性在不同層級(jí)和區(qū)域可能具有不同的重要性和影響力,靜態(tài)權(quán)重分配忽略了這種動(dòng)態(tài)變化,導(dǎo)致聚類結(jié)果的局限性和不準(zhǔn)確性。
11、本技術(shù)引入了動(dòng)態(tài)權(quán)重矩陣w和局部數(shù)據(jù)特征度量,用于衡量不同屬性在聚類過程中的重要性。通過在每次迭代中根據(jù)局部數(shù)據(jù)特征度量和上一次聚類結(jié)果更新動(dòng)態(tài)權(quán)重矩陣,使得聚類算法能夠自適應(yīng)地調(diào)整屬性權(quán)重,充分考慮不同屬性對(duì)聚類結(jié)果的影響。這種動(dòng)態(tài)權(quán)重調(diào)整機(jī)制能夠更好地捕捉建筑工程數(shù)據(jù)在不同層級(jí)和區(qū)域的局部模式和變化,使聚類結(jié)果更加準(zhǔn)確和可靠。
12、進(jìn)一步的,s4,根據(jù)數(shù)據(jù)聚類對(duì)數(shù)據(jù)集進(jìn)行分類歸檔,根據(jù)分類歸檔結(jié)果生成語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a,包括:s41,提取每個(gè)數(shù)據(jù)聚類內(nèi)部數(shù)據(jù)點(diǎn)的共同特征,作為相應(yīng)聚類的語義描述;所述共同特征表示聚類內(nèi)數(shù)據(jù)點(diǎn)屬性分布的一致性或相似性;s42,根據(jù)語義描述,對(duì)數(shù)據(jù)聚類進(jìn)行分類和歸檔,得到具有語義關(guān)聯(lián)的數(shù)據(jù)分類;s43,遍歷數(shù)據(jù)集中的每個(gè)數(shù)據(jù)點(diǎn),根據(jù)數(shù)據(jù)點(diǎn)所屬的數(shù)據(jù)聚類和語義描述,將數(shù)據(jù)點(diǎn)映射到對(duì)應(yīng)的數(shù)據(jù)分類中;s44,提取每個(gè)數(shù)據(jù)分類內(nèi)部數(shù)據(jù)點(diǎn)的屬性信息,構(gòu)建屬性矩陣,屬性矩陣的每行表示一個(gè)數(shù)據(jù)點(diǎn),每列表示一個(gè)屬性;所述屬性包含幾何屬性;s45,根據(jù)數(shù)據(jù)點(diǎn)之間的拓?fù)潢P(guān)系和邏輯關(guān)系,構(gòu)建關(guān)聯(lián)矩陣,關(guān)聯(lián)矩陣表示數(shù)據(jù)點(diǎn)之間的關(guān)聯(lián)強(qiáng)度;s46,利用多維數(shù)組存儲(chǔ)tensorflow,將屬性矩陣和關(guān)聯(lián)矩陣組合成多維數(shù)據(jù)協(xié)同陣列。
13、進(jìn)一步的,s5,對(duì)語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a進(jìn)行降維處理,得到降維數(shù)據(jù)陣列,包括:s51,對(duì)語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a進(jìn)行中心化處理,得到中心化后的矩陣;中心化處理目的是將數(shù)據(jù)的均值遷移到原點(diǎn),使得數(shù)據(jù)在各個(gè)維度上的均值為0。這樣可以消除數(shù)據(jù)的平移影響,使得后續(xù)的特征值分解和降維處理更加準(zhǔn)確和穩(wěn)定。
14、s52,引入核函數(shù),計(jì)算核矩陣k,其中,,表示矩陣數(shù)據(jù)點(diǎn)和在高維特征空間中的內(nèi)積;核函數(shù)可以將原始數(shù)據(jù)映射到高維特征空間,捕捉數(shù)據(jù)的非線性特征。通過計(jì)算數(shù)據(jù)點(diǎn)之間在高維特征空間中的內(nèi)積,得到核矩陣k。這里的數(shù)據(jù)點(diǎn)x_i和x_j是從中心化后的矩陣a'中提取的。
15、s53,對(duì)核矩陣k進(jìn)行中心化處理,得到中心化后的核矩陣;s54,對(duì)中心化后的核矩陣進(jìn)行特征值分解,得到特征值矩陣λ和特征向量矩陣v,即;特征值分解可以提取核矩陣的主要特征和方向,為后續(xù)的降維處理提供基礎(chǔ)。
16、s55,對(duì)特征值矩陣λ進(jìn)行降維處理,選取前k個(gè)最大的特征值,得到降維后的特征值矩陣,其中k為降維后的維度;通過選擇最重要的特征值和特征向量,將數(shù)據(jù)從高維空間映射到低維空間。
17、s56,根據(jù)降維后的特征值矩陣,截?cái)嗵卣飨蛄烤仃噕,得到降維后的特征向量矩陣;s57,計(jì)算降維后的數(shù)據(jù)協(xié)同陣列,即,將降維后的數(shù)據(jù)協(xié)同陣列作為降維數(shù)據(jù)陣列??梢钥醋魇窃紨?shù)據(jù)矩陣a在低維空間中的近似表示。
18、傳統(tǒng)的奇異值分解(svd)假設(shè)數(shù)據(jù)點(diǎn)之間存在線性關(guān)系。然而,語義關(guān)聯(lián)的數(shù)據(jù)協(xié)同陣列a可能存在非線性特征,線性降維方法可能無法有效捕捉數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和復(fù)雜關(guān)系,導(dǎo)致降維后的數(shù)據(jù)陣列失去重要信息。
19、本技術(shù),通過引入核函數(shù),將原始數(shù)據(jù)映射到高維特征空間,在高維特征空間中進(jìn)行特征值分解,可以捕捉數(shù)據(jù)的非線性結(jié)構(gòu)和復(fù)雜關(guān)系。核函數(shù)的選擇可以根據(jù)數(shù)據(jù)的特點(diǎn)和先驗(yàn)知識(shí)來確定,常用的核函數(shù)包括高斯核函數(shù)和多項(xiàng)式核函數(shù)等。對(duì)中心化后的核矩陣進(jìn)行特征值分解,得到特征值矩陣λ和特征向量矩陣v。這相當(dāng)于在高維特征空間中進(jìn)行主成分分析(pca),提取數(shù)據(jù)的主要特征。通過引入核技巧,可以在高維特征空間中進(jìn)行特征提取和降維,有效處理語義關(guān)聯(lián)數(shù)據(jù)協(xié)同陣列中的非線性特征,提高降維的效果和數(shù)據(jù)的表示能力。
20、進(jìn)一步的,s53,對(duì)核矩陣k進(jìn)行中心化處理,得到中心化后的核矩陣,包括:計(jì)算中心化矩陣h:計(jì)算中心化矩陣h,,其中,i為n×n的單位矩陣,為n×n的全1矩陣,n為數(shù)據(jù)點(diǎn)的數(shù)量;利用中心化矩陣h,對(duì)核矩陣k進(jìn)行中心化處理,得到中心化后的核矩陣:。
21、中心化后的核矩陣k',使得核矩陣的行和列均值都為0,消除數(shù)據(jù)的偏置項(xiàng)。中心化處理可以提高核主成分分析的效果,使得提取的特征更加準(zhǔn)確和穩(wěn)定。另一方面避免了在原始空間中顯式計(jì)算數(shù)據(jù)點(diǎn)之間的距離,降低了計(jì)算復(fù)雜度。
22、中心化處理的目的是將核矩陣的行和列均值都轉(zhuǎn)換為0,消除數(shù)據(jù)的偏置項(xiàng),使得核矩陣更加適合進(jìn)行特征值分解。通過引入中心化矩陣h,可以在核空間中實(shí)現(xiàn)數(shù)據(jù)的中心化。
23、進(jìn)一步的,s6,采用基于密度的空間索引方法構(gòu)建降維數(shù)據(jù)陣列的空間索引;利用分布式計(jì)算框架,將建筑工程bim模型劃分為多個(gè)分區(qū),將分區(qū)與空間索引進(jìn)行分布式匹配,得到數(shù)據(jù)匹配點(diǎn)集,包括:s61,對(duì)建筑工程bim模型進(jìn)行空間劃分,劃分為多個(gè)大小相等的分區(qū);s62,對(duì)降維數(shù)據(jù)陣列進(jìn)行劃分,劃分為多個(gè)數(shù)據(jù)空間大小相等的網(wǎng)格單元;s63,計(jì)算每個(gè)網(wǎng)格單元的數(shù)據(jù)點(diǎn)數(shù)量,根據(jù)數(shù)據(jù)點(diǎn)數(shù)量估計(jì)網(wǎng)格單元的密度;s64,選擇密度大于閾值的網(wǎng)格單元作為密集單元,將密集單元內(nèi)的數(shù)據(jù)點(diǎn)插入到空間索引結(jié)構(gòu)中,所述空間索引結(jié)構(gòu)采用r樹結(jié)構(gòu);s65,對(duì)密度小于閾值的網(wǎng)格單元,遞歸地進(jìn)行劃分,直到所有網(wǎng)格單元的密度均大于閾值,或達(dá)到預(yù)設(shè)的最大劃分深度;s66,在空間索引結(jié)構(gòu)的每個(gè)節(jié)點(diǎn)上,存儲(chǔ)節(jié)點(diǎn)對(duì)應(yīng)網(wǎng)格單元內(nèi)的數(shù)據(jù)點(diǎn)信息,數(shù)據(jù)點(diǎn)信息包含數(shù)據(jù)點(diǎn)的坐標(biāo)和屬性;s67,利用分布式計(jì)算框架,將建筑工程bim模型的分區(qū)與對(duì)應(yīng)的空間索引結(jié)構(gòu)進(jìn)行匹配,得到分區(qū)內(nèi)的數(shù)據(jù)匹配點(diǎn)集。
24、本技術(shù)的另一個(gè)方面還提供一種基于bim的建筑工程可視化管理系統(tǒng),用于執(zhí)行本技術(shù)的一種基于bim的建筑工程可視化管理方法。
25、相比于現(xiàn)有技術(shù),本技術(shù)的優(yōu)點(diǎn)在于:
26、bim模型通常包含大量的幾何、材質(zhì)、屬性等多維度數(shù)據(jù),傳統(tǒng)的聚類算法(如k-means)在處理高維數(shù)據(jù)時(shí),容易陷入“維度災(zāi)難”,聚類效果差,計(jì)算復(fù)雜度高。本技術(shù)采用基于密度的聚類算法dbscan,首先,根據(jù)模型的層級(jí)關(guān)系,將數(shù)據(jù)劃分為若干個(gè)層級(jí)子集(如樓層、專業(yè)、構(gòu)件類型等)。然后,在每個(gè)子集內(nèi)部獨(dú)立執(zhí)行dbscan聚類。最后,將不同層級(jí)的聚類結(jié)果進(jìn)行合并和協(xié)調(diào),得到最終的聚類結(jié)果。分層聚類可以減少數(shù)據(jù)的復(fù)雜度,提高聚類的效率和精度。
27、傳統(tǒng)的遍歷目標(biāo)建筑工程的bim數(shù)據(jù)與降維數(shù)據(jù)陣列進(jìn)行匹配,意味著需要進(jìn)行大量的相似度計(jì)算和比較操作。當(dāng)bim模型和數(shù)據(jù)陣列的規(guī)模較大時(shí),這種窮舉式的匹配過程可能非常耗時(shí)和低效。特別是在實(shí)時(shí)應(yīng)用場景下,如施工進(jìn)度跟蹤、設(shè)計(jì)變更分析等,高昂的計(jì)算成本可能成為性能瓶頸,影響系統(tǒng)的響應(yīng)速度和用戶體驗(yàn)。本技術(shù)為了加速匹配過程,對(duì)降維數(shù)據(jù)陣列建立高效的索引結(jié)構(gòu),如kd樹、r樹等。利用索引快速鎖定潛在的匹配候選,避免不必要的相似度計(jì)算。同時(shí),采用并行計(jì)算技術(shù),將匹配任務(wù)分配到多個(gè)處理單元,充分利用計(jì)算資源,提高匹配效率。