Ang 2023 AI Network Innovation Conference na ginanap sa Beijing Intelligent Network Model sa BBS, ang ZTE Cable Products Model Senior Architect Ji'an-Guo Lu ay gumawa ng Wisdom Network New Era: Malaking Model na humimok sa hinaharap ng tema ng ZTE sa pamamagitan ng Fine Tuning Directional Model kakayahan upang mapahusay ang malaking modelo ng intelihensiya na may katalinuhan na antas ng kasanayan.
Sinabi ni Lu Jianguo na maraming mga pangunahing teknolohiya, tulad ng pagpapagana ng AI, digital twin at intensyon drive, ay susuportahan ang antas ng katalinuhan ng network ng self-intelligence mula sa L4 hanggang L5, at gawin ang network ng self-intelligence na patuloy na umulit at magbago upang makumpleto ang intelektwal na sarili. Kabilang sa mga pangunahing teknolohiyang ito, ang AI ang pinakamahalagang makina, at ang mga malalaking modelo ay ang susi sa teknolohiya ng AI.
Sa kung paano mag-aplay ng malaking modelo sa network ng intelihensiya ng sarili, ipinakilala ni Lu Jianguo na ang malaking modelo ay may sobrang kakayahan ng henerasyon at mabilis na makabuo ng isang malaking bilang ng mga scheme. Para sa mga operasyon ng intelektwal na network tulad ng isang pangangailangan upang ipatupad ang isang malaking bilang ng mga hakbang sa operasyon, na katumbas ng sa mataas na dimensional na puwang upang mahanap ang pinakamainam na solusyon, solusyon na itinakda para sa lahat ng posibleng mga proseso, malaking modelo para sa mga pangkalahatang solusyon tulad ng NP (hindi polynomial) na problema, isang malaking bilang ng mga sample, pagsusuri, pag -optimize, pag -iiba ay maaaring maglaro ng mahusay na pruning, mabilis na lumapit sa pinakamainam na solusyon. Gayunpaman, bagaman ang mga malalaking modelo ay bumubuo ng maraming mga scheme, mahirap tiyakin na ang mga scheme na ito ay kapaki -pakinabang. Kahit na ang mga malalaking modelo ay may tiyak na kakayahan sa pag -iisip, kailangan pa rin nila ang interbensyon ng tao kapag nakikipag -usap sa kumplikadong lohika. Upang malutas ang problemang ito, iminumungkahi ng ZTE ang pagsasama ng karanasan sa dalubhasa sa proseso ng pagdaragdag ng pre-pagsasanay at pinong pag-tune ng modelo upang makabuo ng isang closed-loop na pag-ulit. Sa ganitong paraan, ang isang maayos na paglipat mula sa manu -manong pag -aaral ng pampalakas ng feedback upang matanto ang pag -aaral ng feedback ng feedback ay maaaring maisakatuparan, na maaaring epektibong magamit ang kapasidad ng henerasyon ng mga malalaking modelo sa isang banda, at sa kabilang banda, tiyakin na ang nabuong diagnostic scheme ay tumpak at maaasahan. Sa pamamaraan na ito, ito ay isang pangunahing link upang mabuo ang mapa ng kaalaman at kaalaman sa pagpapanatili na sinamahan ng engineering engineering. Ang henerasyon ng scheme ng flywheel ng data ay batay sa mapa ng kaalaman at kaalaman sa pagpapanatili, upang maiwasan ang ilusyon ng modelo at matiyak ang pagiging maaasahan at kawastuhan ng scheme ng henerasyon. Ang diskarte na batay sa graph na ito ay maaaring mas mahusay na pagsamahin ang karanasan sa dalubhasa at mga kakayahan ng henerasyon ng henerasyon upang magbigay ng mas maaasahang mga solusyon.
Para sa disenyo ng lohika ng application ng malaking modelo, ipinakilala pa ni Lu Jianguo na ang ZTE ay tatanggapin ang pamamaraan na hinihimok ng closed-loop na pamamaraan batay sa agarang engineering. Ang kakanyahan ng disenyo ay upang kunin ang nakabalangkas na pagpapahayag ng wika ng tao (prompt template) bilang input, makabuo ng nakabalangkas na output (scheme ng pag -aayos) sa pamamagitan ng malaking modelo, at sa wakas ay pagsamahin ang interactive na pagpapatupad ng balangkas ng aplikasyon. Upang mapagtanto ang nasa itaas na lohika, ang ZTE ay gagawa ng mga teknikal na paghahanda mula sa maraming mga aspeto, tulad ng multi-modal na ebolusyon ng kakayahan, paghahanda ng corpus, mapagkukunan ng kaalaman sa kaalaman ng kaalaman sa kaalaman, pagbuo ng artipisyal na simulation fault environment, digital twin awtomatikong fault simulation environment, at paghahanda ng tool.
Sa wakas sinabi ni Lu Jianguo na ang pangunahing halaga ng malaking modelo ay namamalagi sa kakayahang lumitaw, iyon ay, maaari itong makabuo ng pagbabago sa pamamagitan ng pagsasama ng umiiral na kaalaman. Gayunpaman, ang pagsasakatuparan ng umuusbong na kapasidad na ito ay nakasalalay sa de-kalidad na paggawa ng data, pagtanggap, at pag-ulan. Ang isang mabuting siklo ng data ay ang pagtukoy ng kadahilanan.
Oras ng Mag-post: Nov-20-2023