
İnce kontrolü kaybetmeden yapay zeka destekli görüntü ve video oluşturmaya dalmak istiyorsanız doğru yerdesiniz: ComfyUI, LEGO parçaları gibi kendi üretim hattınızı oluşturmanıza olanak tanıyan düğüm tabanlı bir arayüzdür. Bu kılavuzda, ComfyUI'da görsel efektler (VFX) iş akışlarının nasıl sıfırdan ve ayrıntılı olarak kurulacağını öğreneceksiniz, hem resim hem de video için, hiçbir önemli şeyi kaçırmadan.
Temel konulara ek olarak, metinden görüntüye akışlar, görüntüden görüntüye akışlar, iç boyama, dış boyama, ölçekleme, ControlNet, SDXL, LoRA ve yerleştirmelere bakacağız. AnimateDiff, HunyuanVideo, LTX Video ve Wan 2.1 ile videoya geçiş yapacağızBu, gereksinimler, kurulum, temel parametreler ve kısayollar ve düğüm yöneticileriyle üretkenlik ipuçlarını içerir. Karmaşık kurulumlardan kaçınmak isterseniz, bulut seçeneklerini de ele alacağız.
ComfyUI nedir ve VFX için neden idealdir?
ComfyUI, Stable Diffusion için veri akışını baştan sona görüntülemenize ve değiştirmenize olanak tanıyan düğüm tabanlı bir GUI'dir. Her düğüm belirli bir görevi gerçekleştirir (bir model yükleme, metni kodlama, örnekleme, VAE kodunu çözme vb.) ve kablolarla bağlanır Girişleri ve çıkışları temsil eden bu felsefe, görsel efektler için mükemmeldir: Sinyalin tam olarak nereye girdiğini, nereye dönüştürüldüğünü ve sonucu nasıl etkileyeceğinizi bilirsiniz.
ComfyUI, monolitik arayüzlere kıyasla şeffaflığı ve esnekliğiyle öne çıkıyor. Bu özgürlüğün bedeli ise daha dik bir öğrenme eğrisi ve bazı görsel dikkat dağınıklıklarıdır. (her iş akışı farklı şekilde düzenlenebilir), ancak ödül, hızlı bir şekilde prototip oluşturabilmek, doğru bir şekilde hata ayıklayabilmek ve iş akışlarını tekrarlanabilir bir şekilde paylaşabilmektir.
ComfyUI ve AUTOMATIC1111
Birçok kullanıcı Kararlı Difüzyon için klasik olan AUTOMATIC1111'i kullanıyor. ComfyUI hafiflik, şeffaflık ve prototipleme yeteneklerinde kazanımlar elde ediyorA1111 daha tekdüze ve doğrudan bir his veriyor, ancak daha az ayrıntılı. İç işleyişi anlamak ve görsel efektlerden en iyi şekilde yararlanmak istiyorsanız, ComfyUI güvenli bir seçenek.
İlk adımlar ve temel kontroller
Tuvalle etkileşim kurmak basittir: Tekerlek veya sıkıştırma hareketiyle yakınlaştırın, hareket ettirmek için sürükleyin ve bir düğümün çıktısından diğerinin girişine sürükleyerek bağlantılar oluşturun. Load Checkpoint, CLIP Text Encode, KSampler veya VAE gibi blokları (düğümleri) göreceksinizve veri yolunu temsil eden kablolar.
Metinden resme: temel akış ve temel düğümler
Standart işlem hattı, bir kontrol noktasının yüklenmesini, istemin kodlanmasını, gizli örneklerde örnekleme yapılmasını ve piksellere kod çözülmesini içerir. ComfyUI'daki hemen hemen her şeyin üzerine inşa edildiği iskelet budur..
Yük Kontrol Noktası ile model seçimi
Yük Kontrol Noktası düğümü üç parça sunar: MODEL (gürültü tahmin ağı), CLIP (metin kodlayıcı) ve VAE (piksellerden gizlilere ve tam tersine gitmek için). MODEL KSampler'ı besler, CLIP metin düğümlerine gider ve VAE nihai sonucu çözümlemek için kullanılır.Kontrol noktası olmadan oyun olmaz, bu yüzden iş akışınıza uygun olanı seçin.
CLIP Metin Kodlama ile olumlu ve olumsuz istemler
İki adet CLIP Metin Kodlama düğümü kullanın: Üstteki pozitif, alttaki negatif için. Metin, dağıtımı yönlendiren yüksek çözünürlüklü yerleştirmelere dönüştürülürKavramlara daha fazla veya daha az ağırlık vermek için kelimeleri sözdizimine göre ağırlıklandırabilirsiniz (terim:1.2).
KSampler üretimi ve parametreleri
Sıraya (Queue Prompt) koyduğunuzda örnekleme başlayacaktır. KSampler, tohumu, adımları, örneklemeyi, zamanlayıcıyı ve gürültü giderme gücünü kontrol ederSabit bir tohum tekrarlanabilirlik sağlar; daha fazla adım genellikle ayrıntıları iyileştirir (zaman kaybı pahasına); text2img'deki denoise=1 tam gürültü giderme sürecini uygular.
Boş Gizli Görüntü: çözünürlük ve gruplar
Boş Gizli Görüntü düğümü ilk gizli tuvali oluşturur. Yükseklik ve genişlik 8'in katları olmalıdırTipik boyutlar: SD 1.5 için 512/768 ve SDXL için 1024. Her çalıştırmada birden fazla görüntü istiyorsanız toplu boyutu ayarlayın.
VAE: sıkıştırma ve yeniden yapılandırma
VAE pikseller ve gizliler arasında kodlama ve kod çözme yapar. Bir miktar kayıp veya eser karşılığında verimlilik ve manipüle edilebilir bir gizli alan sağlar.Text2img'de, bunu çoğunlukla sonda (VAE Decode) piksel cinsinden görüntüyü elde etmek için kullanacaksınız.
Görüntüden görüntüye, SDXL ve iç boyama/dış boyama
Resme göre resim
Bu iş akışı bir komut istemini ve bir temel görseli birleştirir. Kontrol noktasını seçin, görüntüyü yükleyin, istemleri inceleyin ve gürültü azaltmayı ayarlayın KSampler'da orijinalden ne kadar sapacağınıza karar verin (daha az gürültü = kaynağa daha çok benzeme).
ComfyUI'da SDXL
ComfyUI, modüler yapısı sayesinde SDXL'i erken ve verimli bir şekilde destekler. Olumlu/olumsuz istemleri hazırlayın ve uygun örnekleyiciyle süreci başlatın; latentin optimum çözünürlüğünü hatırlayın (genellikle 1024).
iç boyama
Belirli alanları değiştirmek için, görüntüyü yükleyin, maske düzenleyicisini açın ve maskeyi düğüme kaydedin. Bu iş akışı standart modelleri kullanır; "iç boyama" kontrol noktası kullanıyorsanız VAE Encode (İç Boyama) kullanın. Standart VAE Encode ve Set Noise Latent Mask düğümleri yerine, değişikliği ve 0.6 gibi tipik bir gürültü giderme gücünü açıklamak için istemi ayarlar.
Dış boyama
Pad Image for Outpainting ile görüntü sınırlarının ötesine geçin: yumuşak geçişler için sol/üst/sağ/alt ve geçiş yumuşatma özelliklerini kontrol edin. VAE Encode'da (İç Boyama için) grow_mask_by'yi ayarlayın (daha iyi >10) Daha doğal ve iyi bütünleşmiş dolgular elde etmek için.
Ölçekleme: piksel ve gizli
Piksel yükseltme
İki yol: Algoritma ile (bikübik, çift doğrusal, en yakın kesin) Upscale Image by ile veya model ile Load Upscale Model + Upscale Image (Model kullanarak) ile. Algoritmalar hızlıdır ancak daha az gelişmiştir; modeller daha uzun sürer ve genellikle daha iyi ayrıntılar sunarve gezileri bir After Effects için 50 efekt paketi.
Gizliliğin yükseltilmesi
Hi-Res Latent Fix adı verilen yöntem, doğrudan gizli uzayda ölçeklenerek yeniden yapılandırma sırasında detayları zenginleştiriyor. Orijinalinden biraz farklı olabilir ve daha yavaş olabilir, ancak bilgi ekler sadece pikselleri germek yerine.
Hızlı karşılaştırma
Piksel yükseltme: hızlı, yeni bilgi eklemeden, mümkün olan düzeltme. Gizli yükseltme: daha yavaş, Detay ekler ancak temel görüntüyü değiştirebilir.Bağlama ve istenen sadakate göre seçim yapın.
ControlNet: yapının hassas kontrolü
ControlNet, modelin yapıya saygı göstermesini sağlamak için sınırlar, poz, derinlik veya segmentasyon gibi yönergeler sağlar. Kompozisyonu ve hareketi tutarlı bir şekilde düzelttiği için VFX için son derece güçlü bir araçtır.Lineart, Depth veya OpenPose'u deneyin ve sadakat/yaratıcılık arasında denge kurmak için gücü ayarlayın.
ComfyUI Yöneticisi: Özel Düğümler Güncel
Eksik düğümleri yükleyin
Bir iş akışı sahip olmadığınız düğümleri talep ederse, Yönetici: düğmesini, "Eksik özel düğümleri yükle"yi kullanın, ComfyUI'yi yeniden başlatın ve tarayıcıyı yeniden yükleyin. Bu, paylaşılan akışı tam olarak kopyalamanızı sağlar..
Düğümleri güncelle
Yönetici'den güncellemeleri kontrol edin ve "Özel düğümleri yükle"ye tıklayın. Bir paketin yanında "Güncelle" görünürse, uygulayın, yeniden başlatın ve yenileyin. Düğümlerin güncel tutulması hataları önler ve işlevselliği artırır.
Tuvalde düğümleri arayın
Boş tuvale çift tıklayarak düğüm bulucuyu açın ve bunları adlarına göre ekleyin. Bu, karmaşık zincirlerin bir araya getirilmesini hızlandırır. Menülerde gezinmeden.
Gömmeler (metin ters çevirme)
Bir yerleştirmeyi etkinleştirmek için olumlu veya olumsuz komut istemine gömme:Ad yazın. Dosyayı ComfyUI/models/embeddings'e yerleştirin ComfyUI, bir eşleşme bulursa bunu uygulayacaktır. Belirli stilleri veya konseptleri dahil etmenin güçlü bir yoludur.
Otomatik tamamlamayı yerleştirme
Otomatik tamamlama için ComfyUI-Custom-Scripts paketini yükleyin. Etkinleştirildikten sonra, "embedding:" yazmaya başladığınızda kullanılabilir yerleştirmeleriniz görüntülenecektirBüyük koleksiyonlarla ilgili çalışmaların hızlandırılması.
Gömme ağırlığı
Bunu tıpkı kelimelerde olduğu gibi ağırlıklandırabilirsiniz: (embedding:Name:1.2) etkiyi artırır ve (embedding:Name:0.8) azaltır. Ağırlıkları ayarlamak, görsel etki üzerinde hassas kontrol sağlar.
LoRA: VAE'ye dokunmadan stili uyarlar
LoRA, VAE'yi olduğu gibi bırakarak, temel kontrol noktasının MODEL ve CLIP'ini değiştirerek stiller, karakterler veya nesneler sunar. Temel akış: kontrol noktasını seçin, bir veya daha fazla LoRA ekleyin, istemleri inceleyin ve kuyruğu başlatın.
Birkaç basamaklı LoRA
Aynı akışta birden fazla LoRA uygulayabilirsiniz; bunlar sırayla birleştirilir. Stilleri yaratıcı bir şekilde karıştırmak için düzen ve ağırlıklarla denemeler yapın İstenilen dengeye ulaşılıncaya kadar.
Saatler kazandıran kısayollar ve püf noktaları
Kopyala/yapıştır: Girişleri koruyarak yapıştırmak için Ctrl+C, Ctrl+V ve Ctrl+Shift+V. Ctrl ile birden fazla düğüm seçin, seçim kutuları oluşturun ve Shift ile bunları taşıyın hızlı düzenleme için.
Bir düğümü Ctrl+M ile sessize almak onu geçici olarak atlar; sol üst köşesindeki noktaya basarak bir düğümü küçültün büyük projelerde tuvali temizlemek için.
Oluşturma kuyruğu: Ctrl+Enter. ComfyUI, yalnızca girdiler değişirse düğümleri yeniden çalıştırır; tohumları düzelterek uzun zincirlerin yeniden hesaplanmasını önler ve zamandan tasarruf sağlar.
PNG gömülü akış: Oluşturulan bir görüntüyü ComfyUI'ye sürükleyerek iş akışını meta verilerinden alın. Boru hatlarını paylaşmanın ve sürümlendirmenin mükemmel bir yoludur Parça kaybetmeden. Videoyla daha iyi öğreniyorsanız, şuraya göz atın: 10 çığır açan video eğitimi.
Video için ComfyUI: AnimateDiff adım adım
AnimateDiff, metin, resim veya videodan diziler oluşturmanıza olanak tanır. NVIDIA'lı Windows için 10 GB VRAM idealdir (daha düşük çözünürlüklerde veya Txt2Vid'de minimum 8 GB); zorlu projelerde 2 ControlNet ile yaklaşık 10 GB bekleyebilirsiniz.
Kurulum ve bağımlılıklar
Düğümleri klonlamak için Git'i, taşınabilir ComfyUI'yi çıkarmak için de 7-Zip'i yükleyin. FFmpeg isteğe bağlıdır (birleştirici düğümlerden GIF/MP4 paketlemek için)Eğer PATH'te değilse, akışlar gevşek çerçeveler üretmeye devam eder.
Taşınabilir ComfyUI'yi indirin ve ilk kez başlatmak için run_nvidia_gpu komutunu çalıştırın. Özel düğümler klasöründe klonlayın ComfyUI-AnimateDiff-Evolved, ComfyUI-Manager, ComfyUI-Advanced-ControlNet ve ComfyUI-VideoHelperSuite.
Yöneticiden “ControlNet Auxiliary Preprocessors” ve “FizzNodes” kurulumunu yapın. Her şeyin doğru şekilde yüklenmesi için ComfyUI'yi yeniden başlatın ve ithalat hatalarından kaçının.
Gerekli modeller
Uyumlu SD 1.5 kontrol noktalarını uygun klasöre yerleştirin ve gerekirse genel bir VAE ekleyin. Hareket modüllerini indirin (örneğin, AnimateDiff, TemporalDiff veya AD Stabilized Motion'daki orijinaller) ve bunları yolunuza kopyalayın. ControlNet için Lineart, Depth ve OpenPose (pth/yaml) ekleyin.
Temel iş akışları: Vid2Vid ve Txt2Vid
Vid2Vid: Görüntü/video giriş düğümüyle bir dizi kare yükler, süre ve örnekleme için image_load_cap, skip_first_images ve select_every_nth'i kontrol eder. Tekdüze Bağlam Seçenekleri çok önemlidir: bağlam uzunluğu ~16, süreklilik için örtüşme ve yalnızca Txt2Vid için kapalı döngü.
Txt2Vid: Birincil çerçeve düğümünü kullanır (görüntü yükleyicisi olmadan) ve doğrudan komut isteminden üretir. KSampler'da Denoise=1 ile tam üretken bir etkiye sahip olacaksınız, yaratıcı klipler için idealdir.
Toplu istem zamanlaması
FizzNodes'un BatchPromptSchedule özelliği, her kare için komut istemlerini değiştirmenize olanak tanır. Yaygın başlıklar ve kapanışlar için pre_text ve app_text kullanır ve "frame: prompt" çiftlerini tanımlar. Son öğedeki son virgüle dikkat edin, hataya neden olur; Aralıklar arasında tutmak istediğiniz bir talimatı çoğaltır.
Örnekleme ve ayarları birleştirme
Video için KSampler daha fazla adım gerektirir (en az 25 ve artırmak daha iyidir). Euler_a örnekleme aracını deneyin ve CFG'yi kendi isteğinize göre ayarlayın.Vid2Vid'de, kaynak klibe yaklaşmak için gürültü azaltmayı azaltın. Combine düğümü GIF/MP4'ü dışa aktarır: kare hızını, döngü sayısını, biçimi ve ping-pong isteyip istemediğinizi tanımlayın.
Pratik ipuçları: Sabit görüntüler için ControlNet gücünü azaltın, OpenPose'u deneyin, "hires" düzeltmesi için ikinci bir KSampler kullanın. Belirli hareketleri zenginleştirmek için Motion LoRA'yı deneyin ve ControlNet'leri az miktarda birleştirir.
ComfyUI'deki diğer video motorları
HunyuanVideo (img2vid altyazılarla yönlendiriliyor)
Resminizi 512x512 çözünürlüğünde hazırlayın ve Florence2Run ile altyazı oluşturun. StringReplace kullanarak "resim/fotoğraf/ilüstrasyon" gibi terimleri "video" ile değiştirin Model eğitimiyle uyumlu hale getirmek için HunyuanVideo Sampler + sarmalayıcıları kullanarak gizli alana dönüştürün, Lora Select'i uygulayın ve birleştiriciyle dışa aktarın.
LTX Video (LTX düğüm hattı)
ComfyUI-LTXVideo düğümlerini ve modellerini yükleyin (PixArt-XL kodlayıcıyı içerir). İstemi CLIP'e yazın, EmptyLTXVLatentVideo ile video latentini oluşturun ve LTXVScheduler'ı ayarlayınAdım sayısı kaliteyi artırır ve max_shift, base_shift, stretch ve terminal gibi parametreler klibin dinamiklerini şekillendirir. SaveAnimatedWEBP (kayıpsız true, kalite 100) ile kaydedin veya diğer formatlara aktarın.
Wan 2.1 (metinden videoya, resminden videoya, videosundan videoya)
ComfyUI ayrıca Wan 2.1 akışlarını da entegre ediyor. Kullanımı Txt2Vid, Img2Vid ve Vid2Vid'i içerir, önceki boru hatlarına benzer parametre kontrolü ve kullanım durumuna bağlı olarak zamansal tutarlılık avantajları ile.
Hareketli grafikler: segmentasyon, derinlik ve harmanlama
Videodan hareketli grafik animasyonları için LoadVideoInput ile başlayın, İlk Kareleri Atla ve Her N'inci Kareyi Seç seçeneklerini kontrol edin ve ImageScaleToMegapixels ile ~1MP'ye kadar ölçekleyin. Bu ön işleme, VRAM yükünü ve çalışma hızını ayarlar nesilde. Ayrıca nasıl olduğunu da kontrol edebilirsiniz Premiere'de başlıklar oluşturun grafikleri ve jenerikleri entegre etmek için.
Konuyu GroundingDINO ve SAM ile GroundingDinoSAMSegment kullanarak metinden ayırın. Maskeyi GrowMaskWithBlur ile büyütün ve MaskToImage ile görüntüye dönüştürün Daha sağlam bir taslak için.
TimeFeatureNode ile bir zaman sinyali oluşturun ve bunu FeatureScaler ile modüle edin (doğrusal, logaritmik, üstel). Bu, klip boyunca derinlik (Z) yer değiştirmelerini veya maske konumlarını kontrol etmenize olanak tanır daha sinematik efektler için.
FlexMaskDepthChamber ile özne maskesini, zaman sinyalini ve klibin derinlik haritasını birleştirerek derinliğe bağlı bir yeniden boyama maskesi oluşturun. Herhangi bir anda etkin bölgeyi tanımlamak için Z Ön/Z Arka ayarını yapın. ve ikna edici bir 3D efekti elde edin.
Üretken aşamada, kontrol noktasını yükleyin, LoRA'ları uygulayın, istemleri yapılandırın ve uygunsa ControlNet'i ekleyin. AnimateDiff size kareleri verecek; ardından pürüzsüzlüğü iki katına çıkarmak için RIFE VFI ile enterpole edecektir ve yumuşak geçişler.
Geçişleri karıştırmak istiyorsanız: farklı göstergelerle birkaç versiyon oluşturun, ImageIntervalSelectPercentage ile segmentleri seçin, ImageBlend ile geçişleri karıştırın ve ImageBatchMulti ile birleştirin. RIFE VFI'dan son bir geçiş animasyonu ipeksi pürüzsüzlüğe kavuşturuyor ve ihracata hazır.
ComfyUI çevrimiçi ve bulut alternatifleri

Hiçbir şey kurmak istemiyorsanız, ComfyUI'nin önceden yapılandırılmış olduğu, yüzlerce düğüm/model ve düzinelerce hazır iş akışına sahip bulut hizmetleri mevcuttur. Hızlı testler veya şablon paylaşan ekipler için faydalıdırlar Yerel acentelerle uğraşmadan. Hızlı ve kolay bir alternatif olarak, şu kaynaklar da mevcuttur: CapCut'ta animasyonlar ve görsel efektler.
Bir diğer seçenek ise Dreamina gibi bulut tabanlı video oluşturucuları kullanmaktır: basit arayüz, yerel VRAM yok ve sonuçlar 20-60 saniye içinde elde edilir. HD yükseltme, kare enterpolasyonu ve ses parçası oluşturma gibi ekstralar sunuyor.Başlamak için günlük ücretsiz kredilerle, ayrıntılı kontrolden çok hızın önemli olduğu durumlarda kullanışlı bir alternatiftir.
Performans, gereksinimler ve zamanlar
Yerel olarak, görüntüden videoya ComfyUI genellikle modele (AnimateDiff, HunyuanVideo, LTX Video) ve çözünürlüğe bağlı olarak 8 ila 24 GB arasında VRAM gerektirir. Güçlü GPU'larda bile bir nesil 10-30 dakika sürebilir Eğer klip uzunsa veya birden fazla ControlNet ve yüksek geçişli filtre kullanıyorsanız, yük buluttaki sağlayıcıya kaydırılır.
ComfyUI'nin yazılımı ücretsizdir, ancak uzun süre çalışırsanız maliyeti donanım ve elektriktir. Bulut, hizmete bağlı kalma ve ücret veya kredi karşılığında bu masraftan kaçınılmasını sağlar.İş akışınıza en çok neyin fayda sağladığını değerlendirin.
Yaygın sorun giderme
Eğer null hataları veya "var olmayan" düğümler görüyorsanız, muhtemelen klasörlerinizde eksik modeller veya kaldırılmış bağımlılıklar vardır. Her düğümün ilişkili bir modelinin olduğunu doğrulayın ve eksik paketleri yüklemek için Yöneticiyi kullanın.ComfyUI'yi başka görevler için kullanıyorsanız çakışan depoları kullanmaktan kaçının.
Tutarlı görsel efektler için en iyi uygulamalar
Zincirin bölümlerini ayarlarken tohumları tekrarlanabilirlik açısından kilitleyin. Görüntüleri iş akışı meta verileriyle kaydedin ve düğüm ve model sürümlerini açıklayınVideoda bağlam uzunluğunu ve örtüşmeleri dikkatli bir şekilde tanımlayın ve ControlNet'ler ile LoRA'ların net bir sırasını koruyun.
Çekim türüne ve ayrıntı düzeyine bağlı olarak yukarı ölçekleme pikseli ve gizli arasında taktiksel olarak geçiş yapın. Vid2Vid'de, temel harekete saygı göstermek için gürültüyü azaltın.Txt2Vid'de görsel kararlılığı sağlamak için adımları ve örneklemeyi kullanın.
Araç kutunuzu genişletmek için Yönetici'den ControlNet ön işlemcilerini (canny, depth, openpose…) entegre edin. Ve unutmayın: ControlNet gücü ne kadar düşükse videoda o kadar iyi performans gösterir.Filtrelenmiş bir görünümden kaçınarak doğal bir görünüm elde ediyoruz.
Eğer durumunuz altyazı kılavuzlarına, farklı zaman dinamikleri kontrolüne veya alternatif kanallara ihtiyaç duyuyorsa HunyuanVideo ve LTX Video'yu mutlaka inceleyin. Wan 2.1 ayrıca Txt2Vid, Img2Vid ve Vid2Vid için sağlam seçenekler de ekliyor tutarlı parametreler ve rekabetçi sonuçlarla.
Hız ve sıfır sürtünme arayanlar çevrimiçi hizmetlere güvenebilirken, cerrahi kontrol ve tam yeniden üretilebilirliğe ihtiyaç duyanlar yerel ComfyUI ile öne çıkacak. Gördüğünüz parçalarla (düğümler, parametreler, kısayollar ve akışlar) artık üst düzey görsel efektler üretmek için bir yol haritasına sahipsiniz. Hem durağan görüntülerde hem de video sekanslarında esnek ve ölçeklenebilir bir şekilde.




