top 30 sas interview questions
Seznam nejpopulárnějších často kladených dotazů na SAS s odpověďmi:
V tomto článku se podíváme na některé základní i pokročilé koncepty programování SAS prostřednictvím nejčastěji kladených dotazů a odpovědí na SAS.
Statistický analytický systém, běžně známý jako SAS, je považován za sadu více softwaru, který je integrován a používá se pro různé operace, jako je správa dat, prediktivní - perspektivní a deskriptivní analýza, zlepšování kvality, obchodní analýza, vývoj aplikací atd.
Velké množství přizpůsobení komponent SAS, stejně jako funkce rozsáhlého programovacího přístupu, společně provádí úlohy analýzy dat a transformace dat. Může běžet na jakémkoli operačním systému (Linux, Windows atd.), Protože je nezávislý na platformě.
Nejoblíbenější otázky a odpovědi na rozhovor SAS
Tady jsme..
Otázka č. 1) Přihlaste se k funkcím prováděným SAS.
Odpovědět: SAS (Statistický analytický systém) má svůj vlastní význam v každé obchodní doméně.
Níže jsou uvedeny některé shrnuté funkce, které provádí SAS:
- Správa dat a řízení projektů
- Skladování dat
- Operativní výzkum a podpora rozhodování
- Získávání informací a řízení kvality
- Obchodní plánování
- Statistická analýza
Otázka 2) Jaké jsou 3 komponenty v programování SAS?
Odpovědět: 3 komponenty v programování SAS jsou:
- Prohlášení
- Proměnné
- Datová sada
Otázka č. 3) Zařaďte pravidla syntaxe, která jsou dodržována v příkazech SAS.
Odpovědět: Program SAS je napsán v okně editoru. Zde obsahuje řadu příkazů, za nimiž následuje správná syntaxe, aby ji program SAS pochopil.
Některá pravidla syntaxe, která se dodržují v případě komponenty Statement SAS, jsou následující:
- Konec libovolného příkazu je označen středníkem (;).
- Středník se také používá k oddělení více příkazů, které se objevují na jednom řádku.
- Příkazy SAS nerozlišují velká a malá písmena a zvláštní mezery před automatickým odstraněním příkazů.
- Do programu SAS pro příkazy lze zahrnout komentáře dvěma různými způsoby, například:
- Řádek začínající hvězdičkou (*) a končící středníkem (;).
- Řádek začínající lomítkem a hvězdičkou (/ *) a končící hvězdičkou a lomítkem (* /).
Otázka č. 4) Jaké jsou datové typy, které SAS obsahuje?
Odpovědět: „Numerický“ a 'Charakter' jsou dva typy datových typů, které program SAS obsahuje.
Otázka č. 5) Co jsou PDV a jejich funkce?
Odpovědět: Program Data Vector (PDV) je logický koncept a je definován jako oblast paměti, kde SAS vytváří datovou sadu.
Funkce PDV jsou následující:
- Vytvoří se databáze s jedním pozorováním najednou.
- Vstupní vyrovnávací paměť pro uchovávání dat z externího souboru je vytvořena v době kompilace.
- PDV obsahuje dvě automatické proměnné, jmenovitě _N_ (zobrazuje počet prováděných datových kroků) a _ERROR_ (upozorňuje na chybu, která nastane v době provedení).
Otázka č. 6) Co víte o datové sadě SAS?
Odpovědět: Datová sada SAS se v zásadě označuje jako data, která jsou k dispozici pro analýzu v rámci programu SAS. Datová sada SAS se také označuje jako datová tabulka SAS.
Datová tabulka SAS se skládá ze dvou částí:
- Sloupce proměnných
- Řady pozorování
Užitečné informace o datové sadě SAS lze shrnout takto:
- Datová sada SAS umí číst stejně jako má vestavěné zdroje dat pro použití jako Excel, Access atd.
- Datová sada, která se používá pouze v aktuálním běhu relace a po ukončení relace se zahodí, se označuje jako dočasná datová sada.
- Datová sada, která je uložena pro použití v budoucí relaci, se také označuje jako stálá datová sada.
- K této integrované datové sadě lze přistupovat pomocí této cesty Knihovny -> Moje knihovny-> SASHELP.
Otázka č. 7) Vysvětlete, proč se ve vstupních příkazech používá dvojitá koncovka @@?
Odpovědět: Během iterace datového kroku, včetně dvojité koncové @@ ve vstupních příkazech, znamená, že SAS by měl držet aktuální záznam za účelem provedení dalšího vstupního příkazu, spíše než přepnout na nový záznam.
Otázka č. 8) Vysvětlete rozdíl mezi možnostmi NODUP a NODUPKEY?
Odpovědět: Pro odstranění duplicitních hodnot z tabulky, PROC SORT se v zásadě dělí na dvě možnosti:
- NODUP
- NODUPKEY
Rozdíl mezi těmito dvěma možnostmi lze vidět níže:
NODUPKEY | NODUP |
---|---|
Porovná pouze proměnnou BY přítomnou v datové sadě. | Porovná všechny proměnné přítomné v datové sadě. |
Odebere duplicitní možnosti pro hodnoty proměnné uvedené v příkazu BY. | Identifikuje a eliminuje duplicitní pozorování. |
Syntax: PROC SORT DATA = čtení NODUPKEY; BY název proměnné; BĚH; | Syntax: PROC SORT DATA = čtení NODUP; BY název proměnné; BĚH; |
Otázka č. 9) Který příkaz se používá k provedení třídění v programu SAS?
Odpovědět: Příkaz PROC SORT se používá k provádění třídění, ať už jde o jednu proměnnou nebo více proměnných. Tento příkaz se provádí na datové sadě, kde je nová datová sada vytvořena jako výsledek řazení, ale původní datová sada zůstane nezměněna.
Syntax:
PROC SORT DATA=original OUT=Sorted; BY variable;
Kde,
„Původní“ označuje původní soubor dat
„Seřazeno“ označuje výsledek jako seřazenou datovou sadu
Pojem „proměnná“ označuje sloupec, ve kterém se provádí operace řazení.
Řazení lze provádět ve vzestupném i sestupném pořadí.
Aby se datová sada zobrazila v sestupném pořadí, používá se v příkazu BY klíčové slovo „sestupně“ s názvem sloupce, podle kterého se má třídit.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Otázka č. 10) Na příkladu vysvětlete rozdíl mezi Informat a Format.
Odpovědět: Rozdíl mezi Informat a Format lze vysvětlit takto:
Zjistit více | Formát |
---|---|
Uveďte SAS, jak číst data do proměnné SAS. | Uveďte SAS, jak zobrazit hodnoty v proměnné. |
Používají se ke čtení dat nebo k převzetí vstupních dat z externích souborů. | Ty se používají k zápisu dat. |
Otázka č. 11) Rozlišujte VSTUP a INFILE.
Odpovědět: Zahrnutí příkazu INFILE do programování SAS identifikuje externí soubor, který se skládá z dat, zatímco zahrnutí příkazu INPUT do programování SAS popisuje použité proměnné.
Syntaxe pro INFILE:
INFILE ‘filename’;
Syntaxe pro VSTUP:
INPUT ‘varname1’ ‘varname2’;
Otázka č. 12) Vysvětlete použití PROC tisku a PROC obsahu?
Odpovědět: Krok PROC programu SAS se používá k vyvolání integrovaných postupů pro analýzu dat datové sady.
PROC tisk: Zajišťuje správné čtení dat obsažených v datové sadě.
Obsah PROC: Zobrazí informace o datové sadě SAS.
Otázka č. 13) Vysvětlit DATA_NULL_?
Odpovědět: Jak název definuje, DATA_NULL_ je krok dat, který ve skutečnosti nevytváří žádnou sadu dat.
Používá se pro:
- Vytváření makro proměnných.
- Zápis výstupu bez jakékoli datové sady.
Otázka č. 14) Jak se proměnná znaků převádí na číselnou proměnnou a naopak?
Odpovědět: V rámci programování SAS vyvstává mnoho úkolů, kde se hodnota znaku má převést na číselnou hodnotu a stejným způsobem se má číselná hodnota převést na hodnotu znaku.
DÁT() se používá k převodu číslice na znak. V tomto případě musí být formát zdroje a typ zdrojové proměnné vždy podobné.
Příklad:
char_var= PUT( num_var, 6.);
INPUT () se používá k převodu znaku na číselný. V tomto případě musí být typ zdrojové proměnné vždy znakové proměnné.
Příklad:
Num_var= INPUT(char_var,2.0);
Otázka č. 15) Jaký je účel _CHARACTER_ a _NUMERIC_?
Odpovědět: V aktuální datové sadě
_CHARAKTER_ definuje všechny znakové proměnné, které jsou aktuálně definovány.
Příklad : K zahrnutí všech znakových proměnných do PROC MEANS se používají následující příkazy:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definuje všechny numerické proměnné, které jsou aktuálně definovány.
Příklad: K zahrnutí všech číselných proměnných do PROC MEANS se používají následující příkazy:
PROC MEANS; Var_numeric_; Run;
Otázka č. 16) Jaké příkazy se používají v případě zahrnutí nebo vyloučení konkrétních proměnných v datové sadě?
Odpovědět: K tomuto účelu se používají možnosti DROP, KEEP a datové sady.
Proměnná, kterou chceme z datového kroku odebrat, je uvedena v příkazu DROP.
Proměnná, kterou chceme zachovat z datového kroku, je uvedena ve výpisu KEEP.
Otázka č. 17) Rozlišujte mezi PROC PROSTŘEDKY a PROC SHRNUTÍ.
Odpovědět: Rozdíl mezi PROC PROSTŘEDKY a PROC SHRNUTÍ lze chápat takto:
PROC ZNAMENÁ | SHRNUTÍ PROC |
---|---|
Tento postup ve výchozím nastavení vytvoří vytištěnou zprávu v okně VÝSTUP. | Tento postup zahrnuje PRINT ve výpisu k vytvoření vytištěné zprávy. |
PROC ZNAMENÁ ve výchozím nastavení bere všechny numerické proměnné v analýze. | SOUHRN PROC vezme proměnné do statistické analýzy, které jsou popsány ve výkazu VAR. |
Otázka č. 18) Vysvětlete účel funkcí SUBSTR v programování SAS.
Odpovědět: V programování SAS, kdykoli existuje požadavek na program abstrakce podřetězce, použije se funkce SUBSTR v případě znakové proměnné.
Když je zadána počáteční pozice a délka, pak se tato funkce používá pro abstrahování řetězce znaků.
Syntax: SUBSTR (char_var, start, length);
Otázka č. 19) Stručně pojmenujte a popište několik znakových funkcí SAS, které se používají k čištění dat.
Odpovědět: Několik funkcí znaků SAS, které se používají k čištění dat, je uvedeno níže:
- Komprimovat (char_string) funkce se používá k odstranění mezer nebo některých zadaných znaků z daného řetězce.
- TRIM (str) funkce se používá k odebrání koncových mezer z daného řetězce.
- LOWCASE (char_string) funkce se používá pro převod všech znaků v daném řetězci na malá písmena.
- UPCASE (char_string) funkce se používá pro převod všech znaků v daném řetězci na velká písmena.
- COMPBL (str) funkce slouží k převodu více mezer na jedno mezery.
Otázka č. 20) Uveďte několik způsobů, jakými se v programování SAS provádí „vyhledání tabulky“.
Odpovědět: V programování SAS lze hodnoty vyhledávání v tabulce ukládat následujícími způsoby:
- Kód
- Pole
- Objekt hash
- Formát
- Datová sada
K provedení ‚vyhledání tabulky 'v SAS se používají následující techniky:
- Výkazy SELECT / WHEN nebo IF / THEN
- Hodnota indexu pole
- Hodnota klíče hash objektu
- Příkaz FORMAT, funkce PUT
- Sloučit, připojit, KEY = Možnost
Podívejme se na příklad, který ukazuje způsob „Code“ k provedení vyhledávání v tabulce pomocí příkazů „IF / THEN“:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Otázka č. 21) Rozlišujte mezi funkcemi CEIL a FlOOR.
Odpověď: Funkce CEIL se používá pro zkrácení číselných hodnot, kde zobrazuje výstup jako nejmenší celé číslo. Tím nejmenším celým číslem zde znamená, že celočíselná hodnota je větší než / rovná argumentu.
Příklad: CEIL (12,85) zobrazí výstup jako 13.
Funkce PODLAHA se používá pro zkrácení číselných hodnot, kde zobrazuje výstup jako největší celé číslo. Podle největšího celého čísla zde znamená, že celočíselná hodnota je menší než / rovná argumentu.
Příklad: FLOOR (12,85) zobrazí výstup jako 12.
Otázka č. 22) Jaké jsou způsoby, jak lze v programování SAS vytvářet proměnné maker?
Odpovědět: K vytváření makro proměnných v programování SAS lze použít celou řadu různých technik.
Níže je uvedeno pět nejčastěji používaných metod:
- Prohlášení% LET
- Makro parametry (pojmenované i poziční)
- % DO prohlášení (iterativní)
- DO PROC SQL
- CALL SYMPUTX rutina
Otázka č. 23) Vysvětlete účel příkazu RETAIN.
Odpovědět: Protože význam slova „RETAIN“ znamená zachovat přidělenou hodnotu, účel příkazu RETAIN je v programování SAS stejný, jak naznačuje jeho význam.
V rámci programu SAS, když je nutné přejít z aktuální iterace na další krok datového kroku, v té době příkaz RETAIN řekne SAS, aby si hodnoty ponechal, místo aby je nastavil na chybějící.
Příklad: Vytiskneme program, který zobrazí výstupní hodnotu „z“ od 1 pomocí příkazu RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Otázka č. 24) Který příkaz se používá k uložení protokolů do externího souboru?
Odpovědět: TISKOVÝ PROCES příkaz se používá k uložení protokolů do externího souboru.
nejlepší bezpečný převodník z youtube na mp3
Příklad:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Otázka č. 25) Uveďte některé běžné chyby, ke kterým obvykle dochází v programování SAS.
Odpovědět: Níže jsou uvedeny některé běžné chyby, ke kterým obvykle dochází, zejména pokud jste v tomto programovacím jazyce nováčkem.
- Základní syntaxe obsahuje středník na konci každého příkazu a chybějící středník je nejčastější chybou.
- Po odeslání programu přeskočíte kontrolu protokolů.
- Chyby komentování, jako je nepoužívání komentářů tam, kde je to nutné, nebo použití komentářů nevhodným způsobem.
- Nepoužívá správné metody ladění.
Otázka č. 26) Uveďte systémové možnosti SAS pro ladění maker SAS.
Odpovědět: K usnadnění sledování kódu makra i kódu SAS generovaného makry lze použít některé možnosti systému.
Oni jsou:
- MLOGICKÉ
- MPRINT
- SYMBOLY
Zprávu, která bude vygenerována těmito možnostmi systému, najdete v protokolu SAS.
Otázka č. 27) Rozlišujte mezi funkcemi SAS a postupy SAS.
Odpovědět: Hlavní rozdíly lze zjistit / porozumět vysvětlenému případu jak pro funkce SAS, tak pro Procedury.
Případ:
Pro Funkce , je hodnota argumentu dodána nebo řekněme převzata pro výpočet napříč pozorováním uvedeným v programovém prohlášení, zatímco v případě Postup , očekává se, že každé pozorování bude mít pouze jednu proměnnou, pomocí které se provede výpočet, jak je uvedeno v následujícím příkladu.
Pochopme to na příkladech:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Zde ve výše uvedených příkladech jsou argumenty předané střední funkci brány pro výpočet jako pozorování.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Tady ve výše uvedeném příkladu Proc znamená, že funkce vypočítá průměrnou teplotu pro jeden argument, který je předán jako pozorování, tj. Podle měsíce.
Otázka č. 28) Co víte o SYMPUT a SYMGET?
Odpověď: Hlavní rozdíly mezi nimi jsou uvedeny níže.
SYMPUT se používá k ukládání hodnoty datové sady do proměnné makra, zatímco SYMGET se používá k načítání hodnoty z proměnné makra do datové sady.
Otázka č. 29) Vysvětlete speciální oddělovače vstupů používané v programování SAS.
Odpovědět: Speciální oddělovače vstupu používané v programování SAS jsou:
- DLM
- DSD
Používají se ve výrazu „INFILE“ a DSD má funkci ignorování oddělovačů, které jsou uvedeny v uvozovkách.
Otázka 30) Která funkce se používá k výpočtu počtu intervalů mezi dvěma daty SAS?
Odpovědět: Intervalová funkce INTCK se používá pro počítání počtu intervalů mezi dvěma danými daty SAS.
Syntax:
INTCK(interval,start-of-period,end-of-period)
Závěr
Zatím jsme viděli několik otázek a odpovědí, které by vám poskytly jasné pochopení konceptů programování SAS a poskytly vám představu o povaze otázek kladených v rozhovorech SAS.
Pokud jste v programování SAS nováčci, znalost některých technologií počítačového programování a znalost jazyka SQL (Structured Query Language) budou pro vás výhodou navíc pro rychlé pochopení a rychlé učení SAS.
Doufám, že jste připraveni sebevědomě čelit jakémukoli pohovoru SAS !!